AWS WAF: H??ng d?n tr¨ªch xu?t d? li?u li?n m?ch cho ng??i d¨´ng Python Web Scraper

Anh Tuan
Data Science Expert
22-Sep-2025

Web scraping, quy tr¨¬nh c?n thi?t ?? thu th?p l??ng l?n d? li?u, th??ng g?p ph?i c¨¢c bi?n ph¨¢p ph¨°ng th? tinh vi nh? AWS Web Application Firewall (WAF) Bot Control. C¨¢c h? th?ng n¨¤y ???c thi?t k? ?? ph?n bi?t gi?a ng??i d¨´ng h?p ph¨¢p v¨¤ bot t? ??ng, g?y ra nh?ng tr? ng?i ?¨¢ng k? cho c¨¢c nh¨¤ ph¨¢t tri?n v¨¤ nh¨¤ khoa h?c d? li?u. Trong khi c¨¢c c?ng c? web scraping truy?n th?ng th??ng g?p kh¨® kh?n khi t??ng t¨¢c v?i nh?ng th¨¢ch th?c ??ng v¨¤ t??ng t¨¢c n¨¤y, d?n ??n c¨¢c y¨ºu c?u b? ch?n v¨¤ vi?c tr¨ªch xu?t d? li?u kh?ng ??y ??, th¨¬ c¨¢ch ti?p c?n ch? ??ng l¨¤ ch¨¬a kh¨®a ?? gi?i quy?t th¨¤nh c?ng c¨¢c th¨¢ch th?c c?a AWS WAF khi web scraping.
B¨¤i vi?t n¨¤y ?i s?u v¨¤o nh?ng chi ti?t ph?c t?p c?a AWS WAF, kh¨¢m ph¨¢ c¨¢c c? ch? c?a n¨® v¨¤ nh?ng th¨¢ch th?c m¨¤ n¨® ??t ra cho c¨¢c web scraper. ?i?u quan tr?ng l¨¤, ch¨²ng t?i s? cung c?p m?t gi?i ph¨¢p chi ti?t, kh? thi s? d?ng Python v¨¤ CapSolver ?? v??t qua nh?ng tr? ng?i n¨¤y. V¨¤o cu?i h??ng d?n n¨¤y, b?n s? hi?u c¨¢ch v??t qua AWS WAF m?t c¨¢ch hi?u qu?, ??m b?o c¨¢c ho?t ??ng web scraping c?a b?n v?n m?nh m? v¨¤ hi?u qu?. Ch¨²ng t?i ??c bi?t khuy¨ºn b?n n¨ºn s? d?ng CapSolver v¨¬ kh? n?ng AI ti¨ºn ti?n c?a n¨®, gi¨²p ??n gi?n h¨®a qu¨¢ tr¨¬nh gi?i quy?t c¨¢c CAPTCHA ph?c t?p v¨¤ c¨¢c th¨¢ch th?c WAF kh¨¢c, ??m b?o lu?ng d? li?u kh?ng b? gi¨¢n ?o?n cho c¨¢c d? ¨¢n c?a b?n.
AWS WAF l¨¤ g¨¬ v¨¤ nh?ng th¨¢ch th?c c?a n¨®
AWS WAF (Web Application Firewall) l¨¤ m?t d?ch v? b?o m?t quan tr?ng do Amazon Web Services cung c?p, gi¨²p b?o v? c¨¢c ?ng d?ng web kh?i c¨¢c l?i web v¨¤ bot ph? bi?n. N¨® ho?t ??ng nh? m?t l¨¢ ch?n, l?c v¨¤ gi¨¢m s¨¢t c¨¢c y¨ºu c?u HTTP v¨¤ HTTPS ??n c¨¢c ?ng d?ng web c?a b?n. M?c d¨´ r?t c?n thi?t cho b?o m?t, nh?ng AWS WAF g?y ra nh?ng tr? ng?i ?¨¢ng k? cho c¨¢c ho?t ??ng web scraping h?p ph¨¢p, th??ng nh?m l?n c¨¢c scraper l¨¤ bot ??c h?i.
AWS WAF ho?t ??ng nh? th? n¨¤o
AWS WAF s? d?ng m?t h? th?ng ph¨°ng th? nhi?u l?p ?? ph¨¢t hi?n v¨¤ gi?m thi?u l?u l??ng truy c?p kh?ng mong mu?n. N¨® ph?n t¨ªch c¨¢c y¨ºu c?u ??n d?a tr¨ºn m?t t?p h?p c¨¢c quy t?c c¨® th? t¨´y ch?nh m¨¤ b?n ??nh ngh?a. C¨¢c quy t?c n¨¤y c¨® th? nh?m m?c ti¨ºu v¨¤o nhi?u m? h¨¬nh t?n c?ng, bao g?m ti¨ºm SQL, k?ch b?n ch¨¦o trang web (XSS) v¨¤ c¨¢c l? h?ng OWASP Top 10 kh¨¢c. ??i v?i web scraping, c¨¢c kh¨ªa c?nh li¨ºn quan nh?t c?a ho?t ??ng c?a AWS WAF li¨ºn quan ??n c¨¢c c? ch? ki?m so¨¢t bot, AWS WAF ph?n lo?i bot th¨¤nh hai lo?i ch¨ªnh:
Bot ph? bi?n
??y th??ng l¨¤ nh?ng bot kh?ng tinh vi kh?ng c? g?ng che gi?u danh t¨ªnh c?a ch¨²ng. AWS WAF ph¨¢t hi?n ch¨²ng b?ng c¨¢ch s? d?ng:
- Ph¨¢t hi?n d?a tr¨ºn ch? k?: AWS duy tr¨¬ m?t c? s? d? li?u c¨¢c ch? k? bot ?? bi?t, bao g?m c¨¢c t¨¢c nh?n ng??i d¨´ng ho?c m? h¨¬nh ti¨ºu ?? c? th?. C¨¢c y¨ºu c?u kh?p v?i c¨¢c ch? k? n¨¤y s? b? g?n c?.
- Danh s¨¢ch danh ti?ng IP: C¨¢c ??a ch? IP li¨ºn quan ??n ho?t ??ng ??c h?i ho?c bot ???c t?ng h?p th¨¤nh danh s¨¢ch, v¨¤ c¨¢c y¨ºu c?u b?t ngu?n t? c¨¢c IP n¨¤y b? ch?n ho?c th¨¢ch th?c.
- X¨¢c th?c t¨¢c nh?n ng??i d¨´ng: Chu?i t¨¢c nh?n ng??i d¨´ng trong m?i y¨ºu c?u ???c ki?m tra k? l??ng ?? ??m b?o r?ng n¨® t??ng ?ng v?i m?t tr¨¬nh duy?t h?p ph¨¢p.
- Ph?n t¨ªch m?u y¨ºu c?u: T? l? y¨ºu c?u b?t th??ng ho?c c¨¢c m?u ?i?u h??ng kh¨¢c v?i h¨¤nh vi c?a con ng??i c¨® th? k¨ªch ho?t ph¨¢t hi?n.
Bot m?c ti¨ºu
Nh?ng bot ti¨ºn ti?n h?n b?t ch??c h¨¤nh vi c?a con ng??i, khi?n ch¨²ng kh¨® ph¨¢t hi?n h?n. AWS WAF ch?ng l?i ?i?u n¨¤y b?ng c¨¢c k? thu?t tinh vi:
- Ph¨¢t hi?n d?a tr¨ºn h¨¤nh vi: C¨¢c m?u l?u l??ng truy c?p ???c ph?n t¨ªch ?? t¨¬m c¨¢c b?t th??ng, ch?ng h?n nh? ?i?u h??ng trang nhanh ho?c truy c?p nhi?u trang theo tr¨¬nh t? kh?ng t? nhi¨ºn.
- H?c m¨¢y (ML): AWS WAF li¨ºn t?c h?c h?i t? d? li?u trong qu¨¢ kh? ?? x¨¢c ??nh c¨¢c h¨¤nh vi bot m?i v¨¤ ?i?u ch?nh c¨¢c m? h¨¬nh ph¨¢t hi?n c?a n¨®.
- Nh?n d?ng d?u v?n tay tr¨¬nh duy?t: C¨¢c ?i?m d? li?u nh? k¨ªch th??c m¨¤n h¨¬nh, plugin ?? c¨¤i ??t v¨¤ ph?ng ch? ???c thu th?p t? tr¨¬nh duy?t. Bot th??ng g?p kh¨® kh?n trong vi?c sao ch¨¦p d?u v?n tay tr¨¬nh duy?t nh?t qu¨¢n v¨¤ h?p ph¨¢p.
- H?i tr¨¬nh duy?t: M? JavaScript ???c ti¨ºm v¨¤o c¨¢c trang web ?? x¨¢c minh kh? n?ng th?c thi c¨¢c script, di chuy?n chu?t ho?c g? c?a m¨¢y kh¨¢ch, nh?ng h¨¤nh ??ng m¨¤ bot c¨® th? kh?ng th?c hi?n ch¨ªnh x¨¢c.
Th¨¢ch th?c ??i v?i Web Scrapers
??i v?i c¨¢c web scraper, c¨¢c bi?n ph¨¢p b?o v? c?a AWS WAF d?n ??n m?t s? th¨¢ch th?c ?¨¢ng k?:
- Th? th¨¢ch CAPTCHA: Khi AWS WAF nghi ng? ho?t ??ng c?a bot, n¨® th??ng ??a ra CAPTCHA (Ki?m tra Turing c?ng c?ng t? ??ng ho¨¤n to¨¤n ?? ph?n bi?t m¨¢y t¨ªnh v¨¤ con ng??i). Nh?ng c?u ?? h¨¬nh ?nh ho?c t??ng t¨¢c n¨¤y ???c thi?t k? ?? d? d¨¤ng cho con ng??i nh?ng kh¨® kh?n ??i v?i c¨¢c script t? ??ng. Vi?c gi?i quy?t CAPTCHA c?a AWS WAF b?ng tay l¨¤ kh?ng th?c t? ??i v?i vi?c scraping quy m? l?n, v¨¤ c¨¢c ph??ng ph¨¢p t? ??ng truy?n th?ng th??ng th?t b?i tr??c s? ph?c t?p ng¨¤y c¨¤ng t?ng c?a ch¨²ng.
- Ch?n IP v¨¤ Gi?i h?n t?c ??: G?i qu¨¢ nhi?u y¨ºu c?u t? m?t ??a ch? IP duy nh?t ho?c v??t qu¨¢ t?c ?? y¨ºu c?u ?? x¨¢c ??nh tr??c c¨® th? d?n ??n vi?c ch?n IP t?m th?i ho?c v?nh vi?n. AWS WAF s? d?ng gi?i h?n t?c ?? th¨ªch ?ng, ?i?m s? danh ti?ng IP v¨¤ gi?i h?n d?a tr¨ºn phi¨ºn, khi?n vi?c lu?n chuy?n IP ??n gi?n l¨¤ kh?ng ??.
- X¨¢c th?c y¨ºu c?u ??ng: AWS WAF ??m b?o r?ng c¨¢c y¨ºu c?u gi?ng nh? c¨¢c y¨ºu c?u t? ng??i d¨´ng th?c. ?i?u n¨¤y li¨ºn quan ??n vi?c x¨¢c th?c ti¨ºu ?? HTTP (User-Agent, Accept, Referer), qu?n l? cookie v¨¤ y¨ºu c?u c¨¢c token ??ng (nh? token CSRF) ???c bao g?m trong c¨¢c y¨ºu c?u ti?p theo. Vi?c kh?ng qu?n l? ?¨²ng c¨¢c y?u t? n¨¤y d?n ??n c¨¢c y¨ºu c?u b? ch?n.
- C? ch? ph¨¢t hi?n ?ang ph¨¢t tri?n: C¨¢c b?n c?p nh?t li¨ºn t?c v¨¤ kh? n?ng h?c m¨¢y c?a AWS WAF c¨® ngh?a l¨¤ c¨¢c k? thu?t b? qua c¨® th? nhanh ch¨®ng tr? n¨ºn l?i th?i. C¨¢c scraper ph?i li¨ºn t?c th¨ªch ?ng v?i c¨¢c ph??ng ph¨¢p ph¨¢t hi?n m?i, ?¨°i h?i ph?i b?o tr¨¬ v¨¤ ph¨¢t tri?n li¨ºn t?c.
Vi?c v??t qua nh?ng th¨¢ch th?c n¨¤y l¨¤ v? c¨´ng quan tr?ng ??i v?i b?t k? ho?t ??ng web scraping th¨¤nh c?ng n¨¤o nh?m m?c ti¨ºu v¨¤o c¨¢c trang web ???c b?o v? b?i AWS WAF. Ch¨¬a kh¨®a n?m ? vi?c ¨¢p d?ng c¨¢c chi?n l??c ti¨ºn ti?n v¨¤ t?n d?ng c¨¢c c?ng c? chuy¨ºn d?ng c¨® th? b?t ch??c h¨¤nh vi c?a con ng??i v¨¤ gi?i quy?t CAPTCHA ph?c t?p m?t c¨¢ch hi?u qu?. ??y l¨¤ n?i c¨¢c gi?i ph¨¢p nh? CapSolver tr? n¨ºn v? c¨´ng qu? gi¨¢, m?t c?ng c? kh?ng th? thi?u ?? ?i?u h??ng s? ph?c t?p c?a AWS WAF.
M? khuy?n m?i CapSolver
??ng b? l? c? h?i t?i ?u h¨®a ho?t ??ng c?a b?n h?n n?a! S? d?ng m? khuy?n m?i CAP25 khi n?p ti?n v¨¤o t¨¤i kho?n CapSolver c?a b?n v¨¤ nh?n th¨ºm 5% ti?n th??ng cho m?i l?n n?p, kh?ng gi?i h?n. Truy c?p B?ng ?i?u khi?n CapSolver
Gi?i quy?t AWS WAF b?ng Python v¨¤ CapSolver
M?c d¨´ AWS WAF ??t ra nh?ng th¨¢ch th?c ?¨¢ng k?, nh?ng ch¨²ng kh?ng ph?i l¨¤ kh?ng th? v??t qua. B?ng c¨¢ch k?t h?p Python v?i m?t d?ch v? gi?i quy?t CAPTCHA m?nh m? nh? CapSolver, b?n c¨® th? v??t qua c¨¢c bi?n ph¨¢p b?o m?t n¨¤y m?t c¨¢ch hi?u qu? v¨¤ ti?p t?c c¨¢c t¨¢c v? web scraping c?a m¨¬nh. CapSolver cung c?p hai ph??ng ph¨¢p ch¨ªnh ?? gi?i quy?t AWS WAF: gi?i ph¨¢p d?a tr¨ºn token v¨¤ gi?i ph¨¢p d?a tr¨ºn nh?n d?ng.
?u ?i?m c?a CapSolver
Tr??c khi ?i s?u v¨¤o vi?c tri?n khai k? thu?t, ?i?u quan tr?ng l¨¤ ph?i hi?u t?i sao CapSolver l?i l¨¤ gi?i ph¨¢p ???c khuy?n ngh?. CapSolver cung c?p m?t d?ch v? m?nh m? v¨¤ ?¨¢ng tin c?y ???c thi?t k? ??c bi?t ?? x? l? nhi?u lo?i CAPTCHA, bao g?m c? nh?ng lo?i ???c tri?n khai b?i AWS WAF. Nh?ng l?i ¨ªch ch¨ªnh c?a n¨® bao g?m:
- ?? ch¨ªnh x¨¢c cao: C¨¢c m? h¨¬nh AI v¨¤ h?c m¨¢y ti¨ºn ti?n c?a CapSolver ??m b?o t? l? th¨¤nh c?ng cao trong vi?c gi?i quy?t CAPTCHA ph?c t?p.
- Kh? n?ng m? r?ng: D?ch v? ???c x?y d?ng ?? x? l? m?t l??ng l?n y¨ºu c?u, ph¨´ h?p v?i c¨¢c ho?t ??ng web scraping quy m? l?n.
- D? d¨¤ng t¨ªch h?p: CapSolver cung c?p m?t API ??n gi?n c¨® th? d? d¨¤ng t¨ªch h?p v¨¤o c¨¢c script Python c?a b?n.
- Hi?u qu? v? chi ph¨ª: So v?i c¨¢c t¨¤i nguy¨ºn c?n thi?t ?? x?y d?ng v¨¤ duy tr¨¬ m?t gi?i ph¨¢p t¨´y ch?nh, CapSolver l¨¤ m?t l?a ch?n ti?t ki?m h?n.
Gi?i ph¨¢p 1: Gi?i quy?t AWS WAF d?a tr¨ºn Token
Ph??ng ph¨¢p d?a tr¨ºn token l¨¤ ph??ng ph¨¢p hi?u qu? nh?t ?? b? qua AWS WAF. N¨® li¨ºn quan ??n vi?c l?y cookie aws-waf-token
h?p l? t? CapSolver, sau ?¨® b?n c¨® th? s? d?ng trong c¨¢c y¨ºu c?u ti?p theo c?a m¨¬nh ??n trang web m?c ti¨ºu. Ph??ng ph¨¢p n¨¤y l? t??ng cho c¨¢c tr??ng h?p m¨¤ trang web ??a ra m?t th¨¢ch th?c CAPTCHA y¨ºu c?u token ?? x¨¢c minh.
Ho?t ??ng nh? th? n¨¤o
- G?p ph?i WAF: Scraper c?a b?n g?i y¨ºu c?u ??n trang web m?c ti¨ºu v¨¤ g?p ph?i th¨¢ch th?c AWS WAF.
- Tr¨ªch xu?t tham s?: B?n tr¨ªch xu?t c¨¢c tham s? c?n thi?t t? trang th¨¢ch th?c, bao g?m
awsKey
,awsIv
,awsContext
v¨¤awsChallengeJS
. - T?o t¨¢c v? v?i CapSolver: B?n g?i c¨¢c tham s? n¨¤y ??n API CapSolver, t?o m?t t¨¢c v? lo?i
AntiAwsWafTask
ho?cAntiAwsWafTaskProxyLess
. - L?y k?t qu? gi?i ph¨¢p: CapSolver x? l? t¨¢c v? v¨¤ tr? v? m?t gi?i ph¨¢p ch?a cookie
aws-waf-token
. - B? qua WAF: B?n bao g?m cookie n¨¤y trong c¨¢c y¨ºu c?u ti?p theo c?a m¨¬nh ??n trang web, b? qua WAF m?t c¨¢ch hi?u qu?.
Tri?n khai Python
D??i ??y l¨¤ m?t script Python minh h?a c¨¢ch s? d?ng gi?i ph¨¢p d?a tr¨ºn token c?a CapSolver:
python
import requests
import time
# Your CapSolver API Key
CAPSOLVER_API_KEY = "YOUR_CAPSOLVER_API_KEY"
CAPSOLVER_CREATE_TASK_ENDPOINT = "https://api.capsolver.com/createTask"
CAPSOLVER_GET_TASK_RESULT_ENDPOINT = "https://api.capsolver.com/getTaskResult"
# The URL of the website protected by AWS WAF
WEBSITE_URL = "https://your-target-website.com" # Replace with your target URL
def solve_aws_waf_token(website_url, capsolver_api_key):
# --- Step 1: Initial request to get WAF parameters ---
# This part of the code needs to be adapted to how the target website
# presents the WAF challenge and where the parameters are located.
# The following is a generalized example.
# It's recommended to use a session object to maintain cookies
session = requests.Session()
response = session.get(website_url)
# Extract awsKey, awsIv, awsContext, awsChallengeJS from the response.text
# This often requires parsing the HTML or JavaScript of the page.
# The exact method will vary depending on the website.
# For this example, we'll use placeholder values.
aws_key = "EXTRACTED_AWS_KEY"
aws_iv = "EXTRACTED_AWS_IV"
aws_context = "EXTRACTED_AWS_CONTEXT"
aws_challenge_js = "EXTRACTED_AWS_CHALLENGE_JS"
# --- Step 2: Create a task with CapSolver ---
task_payload = {
"clientKey": capsolver_api_key,
"task": {
"type": "AntiAwsWafTaskProxyLess",
"websiteURL": website_url,
"awsKey": aws_key,
"awsIv": aws_iv,
"awsContext": aws_context,
"awsChallengeJS": aws_challenge_js
}
}
create_task_response = requests.post(CAPSOLVER_CREATE_TASK_ENDPOINT, json=task_payload).json()
task_id = create_task_response.get('taskId')
if not task_id:
print(f"Error creating CapSolver task: {create_task_response.get('errorDescription')}")
return None
print(f"CapSolver task created with ID: {task_id}")
# --- Step 3: Poll for the task result ---
while True:
time.sleep(5)
get_result_payload = {"clientKey": capsolver_api_key, "taskId": task_id}
get_result_response = requests.post(CAPSOLVER_GET_TASK_RESULT_ENDPOINT, json=get_result_payload).json()
if get_result_response.get('status') == 'ready':
aws_waf_token_cookie = get_result_response['solution']['cookie']
print("CapSolver successfully solved the CAPTCHA.")
return aws_waf_token_cookie
elif get_result_response.get('status') == 'failed':
print(f"CapSolver task failed: {get_result_response.get('errorDescription')}")
return None
# --- Step 4: Use the token in subsequent requests ---
if __name__ == "__main__":
aws_waf_token = solve_aws_waf_token(WEBSITE_URL, CAPSOLVER_API_KEY)
if aws_waf_token:
print(f"Received AWS WAF Token: {aws_waf_token}")
# Use the token in your subsequent requests
headers = {
'Cookie': aws_waf_token
}
final_response = requests.get(WEBSITE_URL, headers=headers)
print("Successfully accessed the website:")
print(final_response.text)
Gi?i ph¨¢p 2: Gi?i quy?t AWS WAF d?a tr¨ºn Nh?n d?ng
Trong m?t s? tr??ng h?p, AWS WAF c¨® th? ??a ra m?t CAPTCHA d?a tr¨ºn h¨¬nh ?nh y¨ºu c?u b?n x¨¢c ??nh c¨¢c ??i t??ng trong h¨¬nh ?nh. ??i v?i nh?ng tr??ng h?p n¨¤y, gi?i ph¨¢p d?a tr¨ºn nh?n d?ng c?a CapSolver l¨¤ c?u tr? l?i. Ph??ng ph¨¢p n¨¤y li¨ºn quan ??n vi?c g?i h¨¬nh ?nh CAPTCHA cho CapSolver ?? ph?n t¨ªch v¨¤ nh?n l?i t?a ?? ho?c ch? s? c?a c¨¢c ??i t??ng ch¨ªnh x¨¢c.
Ho?t ??ng nh? th? n¨¤o
- Ch?p CAPTCHA: Scraper c?a b?n ch?p h¨¬nh ?nh CAPTCHA d?a tr¨ºn h¨¬nh ?nh do AWS WAF ??a ra.
- T?o t¨¢c v? v?i CapSolver: B?n g?i h¨¬nh ?nh (d??i d?ng chu?i ???c m? h¨®a base64) v¨¤ c?u h?i t??ng ?ng ??n API CapSolver, t?o m?t t¨¢c v? lo?i
AwsWafClassification
. - Nh?n k?t qu? gi?i ph¨¢p: CapSolver ph?n t¨ªch h¨¬nh ?nh v¨¤ tr? v? gi?i ph¨¢p, c¨® th? l¨¤ t?a ?? c?a m?t ?i?m ho?c ch? s? c?a c¨¢c h¨¬nh ?nh ch¨ªnh x¨¢c trong l??i.
- G?i gi?i ph¨¢p: Scraper c?a b?n s? d?ng th?ng tin n¨¤y ?? t??ng t¨¢c v?i CAPTCHA tr¨ºn trang web, gi?i quy?t th¨¢ch th?c.
Tri?n khai Python
D??i ??y l¨¤ m?t script Python minh h?a c¨¢ch s? d?ng gi?i ph¨¢p d?a tr¨ºn nh?n d?ng c?a CapSolver:
python
import requests
import base64
# Your CapSolver API Key
CAPSOLVER_API_KEY = "YOUR_CAPSOLVER_API_KEY"
CAPSOLVER_CREATE_TASK_ENDPOINT = "https://api.capsolver.com/createTask"
# The URL of the website protected by AWS WAF
WEBSITE_URL = "https://your-target-website.com" # Replace with your target URL
def solve_aws_waf_image_captcha(image_path, question, capsolver_api_key):
# --- Step 1: Read and encode the image ---
with open(image_path, "rb") as image_file:
encoded_string = base64.b64encode(image_file.read()).decode('utf-8')
# --- Step 2: Create a task with CapSolver ---
task_payload = {
"clientKey": capsolver_api_key,
"task": {
"type": "AwsWafClassification",
"images": [encoded_string],
"question": question
}
}
create_task_response = requests.post(CAPSOLVER_CREATE_TASK_ENDPOINT, json=task_payload).json()
if create_task_response.get('errorId') == 0:
solution = create_task_response.get('solution')
print("CapSolver successfully solved the image CAPTCHA.")
return solution
else:
print(f"Error creating CapSolver task: {create_task_response.get('errorDescription')}")
return None
# --- Step 3: Use the solution to interact with the CAPTCHA ---
if __name__ == "__main__":
# This is a placeholder for the image and question you would extract from the webpage
captcha_image_path = "path/to/your/captcha/image.jpg"
captcha_question = "aws:grid:chair" # Example question
solution = solve_aws_waf_image_captcha(captcha_image_path, captcha_question, CAPSOLVER_API_KEY)
if solution:
vi
print(f"Nh?n ???c gi?i ph¨¢p: {solution}")
# S? d?ng gi?i ph¨¢p (v¨ª d?: ch? m?c ??i t??ng) ?? t??ng t¨¢c v?i trang web
# v¨¤ gi?i quy?t CAPTCHA. Ph?n n¨¤y s? y¨ºu c?u m?t th? vi?n t? ??ng h¨®a tr¨¬nh duy?t
# nh? Selenium ho?c Playwright.
T¨®m t?t so s¨¢nh
T¨ªnh n?ng | Gi?i ph¨¢p d?a tr¨ºn Token | Gi?i ph¨¢p d?a tr¨ºn nh?n d?ng |
---|---|---|
Ph¨´ h?p nh?t cho | Th? th¨¢ch CAPTCHA y¨ºu c?u token | CAPTCHA d?a tr¨ºn h¨¬nh ?nh (v¨ª d?: nh?n d?ng ??i t??ng) |
Qu¨¢ tr¨¬nh | Tr¨ªch xu?t tham s?, l?y token, s? d?ng token trong y¨ºu c?u | Ch?p ?nh, g?i ?? nh?n d?ng, s? d?ng gi?i ph¨¢p ?? t??ng t¨¢c |
?? ph?c t?p | G?i API t??ng ??i ??n gi?n | Y¨ºu c?u t? ??ng h¨®a tr¨¬nh duy?t ?? t??ng t¨¢c v?i CAPTCHA ?? ???c gi?i quy?t |
Ph? thu?c | Th? vi?n requests |
requests , base64 , v¨¤ m?t th? vi?n t? ??ng h¨®a tr¨¬nh duy?t (v¨ª d?: Selenium) |
Lo?i nhi?m v? CapSolver | AntiAwsWafTask / AntiAwsWafTaskProxyLess |
AwsWafClassification |
B?ng c¨¢ch ch?n gi?i ph¨¢p ph¨´ h?p d?a tr¨ºn lo?i th? th¨¢ch AWS WAF m¨¤ b?n g?p ph?i, b?n c¨® th? t? ??ng h¨®a hi?u qu? qu¨¢ tr¨¬nh b? qua v¨¤ ??m b?o c¨¢c ho?t ??ng thu th?p d? li?u web c?a b?n ho?t ??ng tr?n tru. ?? bi?t th¨ºm th?ng tin chi ti?t v¨¤ c¨¢c t¨´y ch?n b? sung, b?n c¨® th? tham kh?o t¨¤i li?u ch¨ªnh th?c c?a CapSolver.
T?i sao CapSolver l¨¤ gi?i ph¨¢p h¨¤ng ??u c?a b?n
Khi n¨®i ??n vi?c gi?i quy?t nh?ng ph?c t?p c?a AWS WAF, vi?c c¨® m?t c?ng c? ?¨¢ng tin c?y v¨¤ hi?u qu? kh?ng ch? l¨¤ m?t l?i th? ¡ª ?¨® l¨¤ m?t ?i?u c?n thi?t. M?c d¨´ c¨® nhi?u ph??ng ph¨¢p ?? ti?p c?n th? th¨¢ch n¨¤y, nh?ng CapSolver n?i b?t nh? m?t gi?i ph¨¢p to¨¤n di?n v¨¤ th?n thi?n v?i nh¨¤ ph¨¢t tri?n. N¨® kh?ng ch? l¨¤ m?t tr¨¬nh gi?i quy?t CAPTCHA; n¨® l¨¤ m?t ??i t¨¢c chi?n l??c trong nh?ng n? l?c thu th?p d? li?u c?a b?n.
Ch?n CapSolver c¨® ngh?a l¨¤ b?n kh?ng ch? nh?n ???c m?t c?ng c? c¨® th? b? qua m?t lo?i CAPTCHA c? th?. B?n ?ang ??u t? v¨¤o m?t d?ch v? li¨ºn t?c th¨ªch nghi v?i b?i c?nh an ninh web ?ang ph¨¢t tri?n. Nh¨®m ??ng sau CapSolver cam k?t ?i tr??c xu h??ng, ??m b?o r?ng c¨¢c gi?i ph¨¢p c?a h? v?n hi?u qu? ch?ng l?i nh?ng ti?n b? m?i nh?t trong c?ng ngh? WAF. Cam k?t n¨¤y cho ph¨¦p b?n t?p trung v¨¤o ho?t ??ng kinh doanh c?t l?i c?a m¨¬nh ¡ª tr¨ªch xu?t v¨¤ ph?n t¨ªch d? li?u ¡ª m¨¤ kh?ng b? v??ng v¨¤o th? gi?i lu?n thay ??i c?a CAPTCHA v¨¤ ph¨¢t hi?n bot.
H?n n?a, s? d? d¨¤ng t¨ªch h?p v?i Python, nh? ???c ch?ng minh trong c¨¢c v¨ª d? m?, l¨¤m cho CapSolver tr? th¨¤nh m?t gi?i ph¨¢p d? ti?p c?n cho c¨¢c nh¨¤ ph¨¢t tri?n ? m?i c?p ?? k? n?ng. Cho d¨´ b?n l¨¤ m?t chuy¨ºn gia thu th?p d? li?u web d¨¤y d?n hay m?i b?t ??u, b?n s? th?y t¨¤i li?u r? r¨¤ng v¨¤ API tr?c quan. S? t¨ªch h?p li?n m?ch n¨¤y, k?t h?p v?i ?? ch¨ªnh x¨¢c v¨¤ kh? n?ng m? r?ng cao c?a d?ch v?, l¨¤m cho CapSolver tr? th¨¤nh m?t ??ng minh m?nh m? trong b? c?ng c? thu th?p d? li?u web c?a b?n. ??i v?i nh?ng ng??i mu?n t? ??ng h¨®a quy tr¨¬nh l¨¤m vi?c c?a m¨¬nh, vi?c kh¨¢m ph¨¢ c¨¢c t¨´y ch?n nh? C¨¢ch t¨ªch h?p CapSolver v?i Selenium | H??ng d?n ho¨¤n ch?nh n?m 2025 c¨® th? mang l?i hi?u qu? cao h?n n?a.
Chi?n l??c n?ng cao ?? thu th?p d? li?u web m?nh m?
Ngo¨¤i vi?c gi?i quy?t CAPTCHA tr?c ti?p, m?t chi?n l??c thu th?p d? li?u web to¨¤n di?n ch?ng l?i AWS WAF bao g?m m?t s? k? thu?t n?ng cao ?? gi?m thi?u vi?c ph¨¢t hi?n v¨¤ duy tr¨¬ quy?n truy c?p li¨ºn t?c. C¨¢c ph??ng ph¨¢p n¨¤y b? sung cho kh? n?ng c?a CapSolver, t?o ra m?t c? s? h? t?ng thu th?p d? li?u m?nh m? h?n.
1. Xoay v¨°ng v¨¤ qu?n l? Proxy
Ch?n IP v¨¤ gi?i h?n t?c ?? l¨¤ c¨¢c chi?n thu?t AWS WAF ph? bi?n. ?? tr¨¢nh nh?ng ?i?u n¨¤y, vi?c xoay v¨°ng proxy m?nh m? l¨¤ r?t c?n thi?t. Thay v¨¬ d?a v¨¤o m?t IP duy nh?t, m?t nh¨®m proxy ?a d?ng (d?n c?, di ??ng ho?c trung t?m d? li?u) c¨® th? ph?n ph?i c¨¢c y¨ºu c?u, khi?n WAF kh¨® h?n trong vi?c x¨¢c ??nh v¨¤ ch?n tr¨¬nh thu th?p d? li?u c?a b?n. Qu?n l? proxy hi?u qu? bao g?m:
- C¨¢c lo?i Proxy ?a d?ng: Proxy d?n c? b?t ch??c l?u l??ng truy c?p c?a ng??i d¨´ng th?c, cung c?p t¨ªnh ?n danh cao h?n. Proxy di ??ng cung c?p s? tin t??ng th?m ch¨ª c¨°n l?n h?n do li¨ºn k?t c?a ch¨²ng v?i c¨¢c m?ng di ??ng h?p ph¨¢p.
- Xoay v¨°ng th?ng minh: Th?c hi?n m?t chi?n l??c xoay v¨°ng thay ??i IP th??ng xuy¨ºn v¨¤ th?ng minh, tr¨¢nh c¨¢c m?u c¨® th? d? ?o¨¢n ???c. C¨¢c c?ng c? nh? C¨¢ch thi?t l?p Proxy ?? gi?i quy?t CAPTCHA c¨® th? h??ng d?n b?n trong vi?c c?u h¨¬nh proxy hi?u qu?.
- Ki?m tra t¨¬nh tr?ng Proxy: Th??ng xuy¨ºn theo d?i hi?u su?t v¨¤ ?? tr? c?a proxy ?? ??m b?o ch? s? d?ng c¨¢c proxy ho?t ??ng t?t.
2. Qu?n l? User-Agent v¨¤ Header
AWS WAF ki?m tra ti¨ºu ?? HTTP, ??c bi?t l¨¤ chu?i User-Agent, ?? x¨¢c ??nh bot. User-Agent kh?ng kh?p ho?c l?i th?i c¨® th? k¨ªch ho?t c? ngay l?p t?c. ?? tr¨¢nh ?i?u n¨¤y:
- Xoay v¨°ng User-Agent: Duy tr¨¬ m?t danh s¨¢ch c¨¢c chu?i User-Agent h?p ph¨¢p v¨¤ c?p nh?t t? nhi?u tr¨¬nh duy?t v¨¤ h? ?i?u h¨¤nh kh¨¢c nhau. Xoay ch¨²ng ng?u nhi¨ºn v?i m?i y¨ºu c?u ho?c phi¨ºn.
- B?t ch??c ti¨ºu ?? tr¨¬nh duy?t th?c: ??m b?o c¨¢c y¨ºu c?u c?a b?n bao g?m m?t b? ti¨ºu ?? ??y ?? (v¨ª d?:
Accept
,Accept-Language
,Referer
,Connection
) m¨¤ m?t tr¨¬nh duy?t th?c s? g?i. C¨¢c ti¨ºu ?? kh?ng nh?t qu¨¢n ho?c thi?u l¨¤ c¨¢c c? ??.
3. Tr¨¬nh duy?t kh?ng c¨® ??u v¨¤ m? ph?ng h¨¤nh vi c?a con ng??i
C¨¢c WAF tinh vi s? d?ng d?u v?n tay tr¨¬nh duy?t v¨¤ c¨¢c th? th¨¢ch JavaScript ?? ph¨¢t hi?n c¨¢c c?ng c? t? ??ng. Tr¨¬nh duy?t kh?ng c¨® ??u (nh? Puppeteer ho?c Playwright) c¨® th? th?c thi JavaScript v¨¤ hi?n th? trang, b?t ch??c h¨¤nh vi c?a tr¨¬nh duy?t th?c ch¨ªnh x¨¢c h?n so v?i c¨¢c y¨ºu c?u HTTP ??n gi?n. Tuy nhi¨ºn, ngay c? c¨¢c tr¨¬nh duy?t kh?ng c¨® ??u c?ng c¨® th? b? ph¨¢t hi?n n?u kh?ng ???c c?u h¨¬nh c?n th?n [2].
- Tr¨¢nh d?u v?n tay: C?u h¨¬nh c¨¢c tr¨¬nh duy?t kh?ng c¨® ??u ?? tr¨¢nh c¨¢c vect? ph¨¢t hi?n ph? bi?n, ch?ng h?n nh? c¨¢c thu?c t¨ªnh tr¨¬nh duy?t c? th? ho?c c? WebDriver. V¨ª d?: m?t s? WAF t¨¬m ki?m
navigator.webdriver
l¨¤true
. - M? ph?ng t??ng t¨¢c c?a con ng??i: Gi?i thi?u ?? tr? ng?u nhi¨ºn gi?a c¨¢c h¨¤nh ??ng, m? ph?ng chuy?n ??ng chu?t v¨¤ b?t ch??c c¨¢c m?u cu?n t? nhi¨ºn. ?i?u n¨¤y l¨¤m cho h¨¤nh vi c?a tr¨¬nh thu th?p d? li?u c?a b?n ¨ªt gi?ng robot h?n. ?? bi?t th¨ºm v? ?i?u n¨¤y, h?y tham kh?o c¨¢c b¨¤i vi?t nh? C¨¢ch t¨ªch h?p CapSolver v?i Playwright | H??ng d?n ho¨¤n ch?nh n?m 2025.
4. Qu?n l? Cookie v¨¤ Phi¨ºn
AWS WAF theo d?i ho?t ??ng phi¨ºn th?ng qua cookie. Qu?n l? cookie ?¨²ng c¨¢ch r?t quan tr?ng ?? duy tr¨¬ tr?ng th¨¢i v¨¤ xu?t hi?n nh? m?t ng??i d¨´ng h?p ph¨¢p [2].
- L?u tr? Cookie: ??m b?o r?ng c¨¢c cookie nh?n ???c t? m¨¢y ch? ???c l?u tr? v¨¤ g?i l?i v?i c¨¢c y¨ºu c?u ti?p theo trong c¨´ng m?t phi¨ºn.
- X? l? Token ??ng: N?u WAF ti¨ºm c¨¢c token ??ng (v¨ª d?: token CSRF) v¨¤o trang, tr¨¬nh thu th?p d? li?u c?a b?n ph?i c¨® kh? n?ng tr¨ªch xu?t v¨¤ ??a ch¨²ng v¨¤o c¨¢c y¨ºu c?u ti?p theo.
5. ?i?u ti?t y¨ºu c?u v¨¤ x? l? l?i
T?c ?? y¨ºu c?u m?nh m? l¨¤ nguy¨ºn nh?n ch¨ªnh g?y ra WAF. Th?c hi?n ?i?u ti?t th?ng minh ?? ki?m so¨¢t t?c ?? c?a c¨¢c y¨ºu c?u c?a b?n.
- ?? tr? th¨ªch ?ng: ?i?u ch?nh ?? tr? y¨ºu c?u d?a tr¨ºn th?i gian ph?n h?i c?a m¨¢y ch? ho?c c¨¢c th? th¨¢ch WAF g?p ph?i. Quay lui khi c¨¢c th¨¢ch th?c t?ng l¨ºn.
- X? l? l?i m?nh m?: Th?c hi?n x? l? l?i to¨¤n di?n ?? qu?n l? m?t c¨¢ch duy¨ºn d¨¢ng c¨¢c kh?i WAF, c¨¢c th? th¨¢ch CAPTCHA v¨¤ c¨¢c s? c? thu th?p d? li?u kh¨¢c. ?i?u n¨¤y cho ph¨¦p tr¨¬nh thu th?p d? li?u c?a b?n ph?c h?i v¨¤ th¨ªch ?ng.
B?ng c¨¢ch t¨ªch h?p c¨¢c chi?n l??c n?ng cao n¨¤y v?i kh? n?ng gi?i quy?t CAPTCHA chuy¨ºn d?ng c?a CapSolver, b?n c¨® th? x?y d?ng m?t gi?i ph¨¢p thu th?p d? li?u web m?nh m? v¨¤ hi?u qu?, c¨® kh? n?ng ?i?u h??ng ngay c? nh?ng bi?n ph¨¢p b?o v? AWS WAF nghi¨ºm ng?t nh?t. Ph??ng ph¨¢p ?a d?ng n¨¤y kh?ng ch? ??m b?o vi?c tr¨ªch xu?t d? li?u th¨¤nh c?ng m¨¤ c¨°n ??m b?o kh? n?ng t?n t?i l?u d¨¤i c?a ho?t ??ng thu th?p d? li?u c?a b?n. ?? c¨® c¨¢i nh¨¬n t?ng quan v? vi?c tr¨¢nh b? ph¨¢t hi?n, h?y xem x¨¦t ??c User-Agent t?t nh?t cho vi?c thu th?p d? li?u web & C¨¢ch s? d?ng ch¨²ng.
K?t lu?n
?i?u h??ng nh?ng ph?c t?p c?a AWS WAF trong qu¨¢ tr¨¬nh thu th?p d? li?u web c¨® th? l¨¤ m?t nhi?m v? kh¨® kh?n, nh?ng v?i c¨¢c chi?n l??c v¨¤ c?ng c? ph¨´ h?p, ?i?u ?¨® ho¨¤n to¨¤n c¨® th? ??t ???c. Ch¨²ng t?i ?? kh¨¢m ph¨¢ c¨¢c c? ch? ph?c t?p c?a AWS WAF, nh?ng th¨¢ch th?c m¨¤ n¨® ??t ra cho c¨¢c tr¨¬nh thu th?p d? li?u v¨¤ quan tr?ng h?n, c¨¢ch kh?c ph?c nh?ng tr? ng?i n¨¤y b?ng Python v¨¤ kh? n?ng m?nh m? c?a CapSolver. B?ng c¨¢ch hi?u c? gi?i ph¨¢p d?a tr¨ºn token v¨¤ d?a tr¨ºn nh?n d?ng, v¨¤ t¨ªch h?p ch¨²ng v?i c¨¢c k? thu?t thu th?p d? li?u n?ng cao nh? xoay v¨°ng proxy, qu?n l? ti¨ºu ?? th?ng minh v¨¤ m? ph?ng h¨¤nh vi c?a con ng??i, b?n c¨® th? x?y d?ng m?t c? s? h? t?ng thu th?p d? li?u m?nh m? v¨¤ hi?u qu?.
CapSolver n?i l¨ºn nh? m?t th¨¤nh ph?n quan tr?ng trong h? sinh th¨¢i n¨¤y, cung c?p c¨¢c gi?i ph¨¢p ch¨ªnh x¨¢c cao, c¨® th? m? r?ng v¨¤ d? t¨ªch h?p ?? b? qua c¨¢c th? th¨¢ch AWS WAF. Vi?c li¨ºn t?c th¨ªch ?ng v?i c¨¢c bi?n ph¨¢p b?o m?t m?i ??m b?o c¨¢c lu?ng d? li?u c?a b?n kh?ng b? gi¨¢n ?o?n, cho ph¨¦p b?n t?p trung v¨¤o nh?ng hi?u bi?t c¨® gi¨¢ tr? m¨¤ d? li?u c?a b?n cung c?p.
S?n s¨¤ng n?ng cao tr¨° ch?i thu th?p d? li?u web c?a b?n v¨¤ chinh ph?c AWS WAF? ??ng ?? CAPTCHA v¨¤ ph¨¢t hi?n bot c?n ???ng b?n. H?y th?c hi?n b??c ??u ti¨ºn h??ng t?i vi?c tr¨ªch xu?t d? li?u li?n m?ch ngay h?m nay.
C?u h?i th??ng g?p (FAQ)
C?u 1: AWS WAF l¨¤ g¨¬ v¨¤ t?i sao n¨® l?i l¨¤ m?t th¨¢ch th?c ??i v?i vi?c thu th?p d? li?u web?
AWS WAF (T??ng l?a ?ng d?ng web) l¨¤ m?t d?ch v? b?o m?t b?o v? c¨¢c ?ng d?ng web kh?i c¨¢c cu?c khai th¨¢c web v¨¤ bot ph? bi?n. N¨® th¨¢ch th?c vi?c thu th?p d? li?u web b?ng c¨¢ch ph¨¢t hi?n l?u l??ng truy c?p t? ??ng th?ng qua nhi?u c? ch? nh? CAPTCHA, ch?n IP, gi?i h?n t?c ?? v¨¤ x¨¢c th?c y¨ºu c?u ??ng. Nh?ng bi?n ph¨¢p n¨¤y ???c thi?t k? ?? ng?n ch?n bot truy c?p ho?c thao t¨²ng n?i dung trang web, khi?n vi?c thu th?p d? li?u c?a c¨¢c tr¨¬nh thu th?p d? li?u tr? n¨ºn kh¨® kh?n m¨¤ kh?ng b? ph¨¢t hi?n v¨¤ ch?n.
C?u 2: CapSolver gi¨²p ¨ªch nh? th? n¨¤o trong vi?c b? qua AWS WAF?
CapSolver l¨¤ m?t d?ch v? gi?i quy?t CAPTCHA chuy¨ºn d?ng s? d?ng AI v¨¤ m¨¢y h?c ?? b? qua c¨¢c th? th¨¢ch AWS WAF. N¨® cung c?p hai gi?i ph¨¢p ch¨ªnh: ph??ng ph¨¢p d?a tr¨ºn token (AntiAwsWafTask
) cung c?p cookie aws-waf-token
?? b? qua WAF v¨¤ ph??ng ph¨¢p d?a tr¨ºn nh?n d?ng (AwsWafClassification
) cho CAPTCHA d?a tr¨ºn h¨¬nh ?nh. API c?a CapSolver cho ph¨¦p t¨ªch h?p li?n m?ch v¨¤o c¨¢c script thu th?p d? li?u Python, t? ??ng h¨®a qu¨¢ tr¨¬nh gi?i quy?t CAPTCHA.
C?u 3: T?i c¨® th? b? qua AWS WAF m¨¤ kh?ng c?n s? d?ng d?ch v? c?a b¨ºn th? ba nh? CapSolver kh?ng?
M?c d¨´ v? m?t k? thu?t c¨® th? c? g?ng b? qua AWS WAF m¨¤ kh?ng c?n d?ch v? c?a b¨ºn th? ba, nh?ng ?i?u ?¨® kh¨® kh?n h?n nhi?u v¨¤ th??ng ¨ªt hi?u qu? h?n ??i v?i vi?c thu th?p d? li?u quy m? l?n ho?c li¨ºn t?c. C¨¢c ph??ng ph¨¢p th? c?ng y¨ºu c?u li¨ºn t?c th¨ªch ?ng v?i c¨¢c bi?n ph¨¢p ph¨°ng th? WAF ?ang ph¨¢t tri?n, v¨¤ vi?c x?y d?ng logic gi?i quy?t CAPTCHA t¨´y ch?nh l¨¤ t?n nhi?u t¨¤i nguy¨ºn. C¨¢c d?ch v? c?a b¨ºn th? ba nh? CapSolver chuy¨ºn v? l?nh v?c n¨¤y, cung c?p c¨¢c gi?i ph¨¢p ???c c?p nh?t li¨ºn t?c v¨¤ t? l? th¨¤nh c?ng cao kh¨® c¨® th? sao ch¨¦p ??c l?p.
C?u 4: M?t s? th?c ti?n t?t nh?t ?? thu th?p d? li?u web t? c¨¢c trang web ???c b?o v? b?i AWS WAF l¨¤ g¨¬?
Ngo¨¤i vi?c s? d?ng tr¨¬nh gi?i quy?t CAPTCHA nh? CapSolver, c¨¢c th?c ti?n t?t nh?t bao g?m vi?c th?c hi?n xoay v¨°ng v¨¤ qu?n l? proxy m?nh m?, xoay v¨°ng user-agent v¨¤ ti¨ºu ?? th?ng minh, m? ph?ng h¨¤nh vi c?a con ng??i v?i c¨¢c tr¨¬nh duy?t kh?ng c¨® ??u (bao g?m c? vi?c tr¨¢nh d?u v?n tay tr¨¬nh duy?t), qu?n l? cookie v¨¤ phi¨ºn hi?u qu? v¨¤ ?i?u ti?t y¨ºu c?u th¨ªch ?ng. M?t ph??ng ph¨¢p nhi?u l?p k?t h?p c¨¢c k? thu?t n¨¤y v?i m?t d?ch v? gi?i quy?t CAPTCHA ?¨¢ng tin c?y cung c?p gi?i ph¨¢p m?nh m? nh?t.
C?u 5: Vi?c thu th?p d? li?u web t? c¨¢c trang web ???c b?o v? b?i AWS WAF c¨® h?p ph¨¢p kh?ng?
T¨ªnh h?p ph¨¢p c?a vi?c thu th?p d? li?u web r?t ph?c t?p v¨¤ ph? thu?c v¨¤o nhi?u y?u t?, bao g?m c¨¢c ?i?u kho?n d?ch v? c?a trang web, b?n ch?t c?a d? li?u ???c thu th?p v¨¤ khu v?c ph¨¢p l?. M?c d¨´ AWS WAF nh?m m?c ?¨ªch ng?n ch?n quy?n truy c?p tr¨¢i ph¨¦p, nh?ng h¨¤nh ??ng thu th?p d? li?u t? n¨® kh?ng ph?i l¨¤ b?t h?p ph¨¢p. Tuy nhi¨ºn, vi?c b? qua c¨¢c bi?n ph¨¢p b?o m?t c¨® th? d?n ??n c¨¢c v?n ?? ph¨¢p l?. ?i?u quan tr?ng l¨¤ ph?i tham kh?o ? ki?n c?a lu?t s? v¨¤ tu?n th? c¨¢c th?c ti?n thu th?p d? li?u ??o ??c, t?n tr?ng c¨¢c t?p robots.txt
v¨¤ ?i?u kho?n d?ch v? c?a trang web. ?? bi?t th¨ºm th?ng tin v? t¨ªnh h?p ph¨¢p c?a vi?c thu th?p d? li?u web, b?n c¨® th? tham kh?o c¨¢c ngu?n nh? Vi?c thu th?p d? li?u web c¨® h?p ph¨¢p kh?ng? H??ng d?n to¨¤n di?n n?m 2025.
Tuy¨ºn b? Tu?n th?: Th?ng tin ???c cung c?p tr¨ºn blog n¨¤y ch? mang t¨ªnh ch?t tham kh?o. CapSolver cam k?t tu?n th? t?t c? c¨¢c lu?t v¨¤ quy ??nh hi?n h¨¤nh. Vi?c s? d?ng m?ng l??i CapSolver cho c¨¢c ho?t ??ng b?t h?p ph¨¢p, gian l?n ho?c l?m d?ng l¨¤ ho¨¤n to¨¤n b? c?m v¨¤ s? b? ?i?u tra. C¨¢c gi?i ph¨¢p gi?i captcha c?a ch¨²ng t?i n?ng cao tr?i nghi?m ng??i d¨´ng trong khi ??m b?o tu?n th? 100% trong vi?c gi¨²p gi?i quy?t c¨¢c kh¨® kh?n v? captcha trong qu¨¢ tr¨¬nh thu th?p d? li?u c?ng khai. Ch¨²ng t?i khuy?n kh¨ªch vi?c s? d?ng d?ch v? c?a ch¨²ng t?i m?t c¨¢ch c¨® tr¨¢ch nhi?m. ?? bi?t th¨ºm th?ng tin, vui l¨°ng truy c?p ?i?u kho?n D?ch v? v¨¤ Ch¨ªnh s¨¢ch Quy?n ri¨ºng t?.
Th¨ºm

L¨¤m th? n¨¤o ?? gi?i quy?t m?i phi¨ºn b?n c?a reCAPTCHA Enterprise v2, v2 v? h¨¬nh, v3, v3 Enterprise ?i?m 0.9
N?m v?ng c¨¢ch gi?i quy?t m?i phi¨ºn b?n reCaptcha v?i CapSolver: H??ng d?n n¨¤y cung c?p h??ng d?n t?ng b??c ?? gi?i quy?t reCaptcha m?t c¨¢ch hi?u qu?, ??m b?o k?t qu? ch¨ªnh x¨¢c m?i l?n.

Anh Tuan
11-Oct-2025

L¨¤m th? n¨¤o ?? gi?i CAPTCHA h¨¬nh ?nh
B¨¤i vi?t n¨¤y cung c?p m?t h??ng d?n to¨¤n di?n v? c¨¢ch gi?i captcha h¨¬nh ?nh b?ng CapSolver, m?t c?ng c? ???c thi?t k? ?? t? ??ng h¨®a quy tr¨¬nh. N¨® b?t ??u b?ng vi?c gi?i th¨ªch v? kh¨¢i ni?m captcha h¨¬nh ?nh, sau ?¨® l¨¤ m?t h??ng d?n chi ti?t t?ng b??c v? c¨¢ch s? d?ng API c?a CapSolver ?? gi?i c¨¢c captcha n¨¤y. H??ng d?n bao g?m c¨¢c v¨ª d? v? c¨¢c y¨ºu c?u v¨¤ ph?n h?i li¨ºn quan ??n quy tr¨¬nh. B¨¤i vi?t k?t th¨²c b?ng m?t nh?n x¨¦t v? hi?u qu? v¨¤ ti?n l?i khi s? d?ng CapSolver ?? gi?i captcha h¨¬nh ?nh, l¨¤m cho n¨® tr? th¨¤nh m?t ngu?n t¨¤i nguy¨ºn qu? gi¨¢ cho nh?ng ng??i mu?n t? ??ng h¨®a c¨¢c nhi?m v? li¨ºn quan ??n vi?c gi?i captcha.

Anh Tuan
11-Oct-2025

Gi?i reCaptcha v2 Enterprise
Trong th? gi?i s?, an ninh v¨¤ s? ti?n l?i cho ng??i d¨´ng th??ng ? hai ??u m¨²t ??i l?p c?a thang ?o. CAPTCHAs, ??c bi?t l¨¤ reCaptcha, ?? ?¨®ng vai tr¨° thi?t y?u trong vi?c t¨¬m ra s? c?n b?ng gi?a hai y?u t? n¨¤y. Tuy nhi¨ºn, n?u b?n c?n gi?i quy?t c¨¢c b¨¤i ki?m tra reCaptcha th??ng ph?c t?p v¨¤ t?n th?i gian, ??c bi?t l¨¤ reCaptcha V2 Enterprise, v¨¬ m?t m?c ?¨ªch h?p ph¨¢p nh? ki?m th? t? ??ng th¨¬ sao? Trong b¨¤i vi?t n¨¤y, ch¨²ng t?i s? h??ng d?n b?n qua quy tr¨¬nh gi?i reCaptcha V2 Enterprise b?ng API c?a CapSolver.

Anh Tuan
11-Oct-2025

Gi?i reCaptcha v3
H?c c¨¢ch gi?i reCaptcha V3 b?ng CapSolver: nhi?u lo?i nhi?m v?, t¨ªch h?p API ??n gi?n v¨¤ c¨¢c gi?i ph¨¢p hi?u qu? cho t? ??ng h¨®a v¨¤ ki?m th?

Anh Tuan
10-Oct-2025

C¨¢i n¨¤o l¨¤ gi?i ph¨¢p AWS WAF t?t nh?t trong khi qu¨¦t web v¨¤o n?m 2025?
H?c c¨¢ch gi?i quy?t CAPTCHA AWS WAF hi?u qu? b?ng CapSolver v¨¤o n?m 2025. H??ng d?n t?ng b??c, t¨ªch h?p Python, c?ng c? AI ?? t?ng t?c quy tr¨¬nh t? ??ng h¨®a c?a b?n. V??t qua c¨¢c token ??ng, ph?n t¨ªch h¨¤nh vi v¨¤ c¨¢c th¨¢ch th?c CAPTCHA ph?c t?p m?t c¨¢ch d? d¨¤ng.

Lucas Mitchell
26-Sep-2025

C¨¢ch gi?i quy?t reCaptcha v3 Enterprise
H?c c¨¢ch gi?i quy?t reCAPTCHA v3 Enterprise m?t c¨¢ch d? d¨¤ng b?ng Capsolver: ch¨¬a kh¨®a c?a b?n ?? v??t qua CAPTCHA ph?c t?p v?i ph?n t¨ªch r?i ro n?ng cao v¨¤ t¨ªch h?p li?n m?ch

Anh Tuan
24-Sep-2025