C¨¢ch gi?i quy?t th? th¨¢ch Cloudflare JS ?? thu th?p d? li?u web v¨¤ t? ??ng h¨®a

Anh Tuan
Data Science Expert
05-Mar-2025

H?y c¨´ng ??t b?i c?nh: B?n ?ang m?i m¨º v?i m?t d? ¨¢n thu th?p d? li?u web¡ªc¨® th? b?n ?ang l?y gi¨¢ s?n ph?m cho kh¨¢ch h¨¤ng ho?c thu th?p d? li?u cho m?t nghi¨ºn c?u th? tr??ng tuy?t v?i. Script c?a b?n ?ang ho?t ??ng t?t, v¨¤ sau ?¨®¡ªb¨´m!¡ªb?n g?p ph?i Th? th¨¢ch JS c?a Cloudflare. N¨® gi?ng nh? m?t ng??i b?o v? k? thu?t s? ?ang nh¨¬n ch?m ch?m v¨¤o b?n, khoanh tay, t? ch?i cho v¨¤o. ??t nhi¨ºn, tr¨¬nh thu th?p d? li?u c?a b?n b? d?ng l?i, v¨¤ b?n t? h?i, ¡°L¨¤m th? n¨¤o ?? t?i v??t qua th? n¨¤y?¡± T?i ?? t?ng ? ?¨®, v¨¤ tin t?i ?i, ?i?u ?¨® th?t kh¨® ch?u. Nh?ng ??y l¨¤ tin t?t: c¨® m?t c¨¢ch ?? v??t qua, v¨¤ t?i s? h??ng d?n b?n t?ng b??c m?t.
Trong h??ng d?n n¨¤y, ch¨²ng ta s? gi?i th¨ªch Th? th¨¢ch JS c?a Cloudflare l¨¤ g¨¬, t?i sao n¨® l?i l¨¤ m?t tr? ng?i ??i v?i m?i ng??i thu th?p d? li?u, v¨¤ l¨¤m th? n¨¤o ?? gi?i quy?t n¨® nh? m?t chuy¨ºn gia. T? c¨¢c c?ng c? th?ng minh ??n t¨ªch h?p li?n m?ch (g?i l¨¤ CapSolver!), t?i ?? h? tr? b?n b?ng c¨¢c m?o th?c t? v¨¤ th?m ch¨ª c? m?t s? m? ?? b?n b?t ??u. H?y c¨´ng ph¨¢ v? th? th¨¢ch n¨¤y!
Th? th¨¢ch JS c?a Cloudflare l¨¤ g¨¬ v¨¤ t?i sao n¨® quan tr?ng
V?y, Th? th¨¢ch JS n¨¤y l¨¤ g¨¬? H?y t??ng t??ng n¨® nh? m?t c¨¢ch Cloudflare ?¨®ng vai tr¨° ng??i g¨¢c c?ng. Khi b?n truy c?p v¨¤o m?t trang web m¨¤ n¨® b?o v?, n¨® c¨® th? hi?n th? m?t trang "?ang ki?m tra tr¨¬nh duy?t c?a b?n" nhanh ch¨®ng. ?¨® ch¨ªnh l¨¤ Th? th¨¢ch JavaScript ?ang ho?t ??ng. N¨® ch?y m?t script nh? tinh ranh ?? ki?m tra xem b?n c¨® ph?i l¨¤ m?t ng??i th?t v?i m?t tr¨¬nh duy?t th?c s? hay ch? l¨¤ m?t bot ?ang c? g?ng l?n v¨¤o. ??i v?i ch¨²ng ta, con ng??i, ?i?u ?¨® kh?ng c¨® g¨¬ to t¨¢t¡ªm?t v¨¤i gi?y, v¨¤ ch¨²ng ta ?? v¨¤o ???c. Nh?ng ??i v?i c¨¢c tr¨¬nh thu th?p d? li?u web? ?¨® l¨¤ m?t b?c t??ng g?ch.
Cloudflare s? d?ng ?i?u n¨¤y ?? b?o v? c¨¢c trang web kh?i l?u l??ng t? ??ng¡ªh?y ngh? ??n c¨¢c cu?c t?n c?ng DDoS ho?c c¨¢c bot ?¨®i d? li?u nh? ch¨ªnh b?n. Kh?ng gi?ng nh? CAPTCHA truy?n th?ng, n?i b?n ch?n c¨¢c bi?n b¨¢o d?ng m?, Th? th¨¢ch JS ho?t ??ng ?m th?m trong n?n, khi?n n¨® kh¨® v??t qua h?n. T?i sao ?i?u n¨¤y l?i quan tr?ng? B?i v¨¬ n?u b?n ?ang thu th?p d? li?u ho?c t? ??ng h¨®a b?t c? th? g¨¬ ? quy m? l?n, b?n s? g?p ph?i c¨¢c trang web ???c Cloudflare b?o v? th??ng xuy¨ºn h?n. T¨¬m ra ?i?u n¨¤y kh?ng ch? ti?n d?ng¡ªm¨¤ c¨°n r?t c?n thi?t.
Nh?ng th¨¢ch th?c m¨¤ c¨¢c c?ng c? thu th?p d? li?u web v¨¤ t? ??ng h¨®a ph?i ??i m?t
???c r?i, h?y n¨®i v? l? do t?i sao ?i?u n¨¤y l?i kh¨® ch?u ??i v?i ch¨²ng ta, nh?ng ng??i thu th?p d? li?u. H?y t??ng t??ng script Python ?¨¢ng tin c?y c?a b?n, ?ang ho?t ??ng t?t v?i requests.get()
, ch? ?? ??m s?m v¨¤o trang trung gian Cloudflare ?¨®. T?i sao? B?i v¨¬:
- JavaScript l¨¤ ?ng ch?: H?u h?t c¨¢c c?ng c? thu th?p d? li?u c? b?n kh?ng th? ch?y JavaScript. Ch¨²ng gi?i vi?c l?y HTML t?nh, nh?ng Th? th¨¢ch JS? Kh?ng, ch¨²ng b? m?c k?t.
- V?n ?? IP: G?i qu¨¢ nhi?u y¨ºu c?u t? m?t IP, v¨¤ Cloudflare s? nh?n m?t. Ti?p t?c nh? v?y, v¨¤ b?n s? ph?i ??i m?t v?i nh?ng th? th¨¢ch kh¨® kh?n h?n ho?c b? c?m ho¨¤n to¨¤n.
- Th?m h?a d?u v?n tay: Cloudflare ?ang d¨° t¨¬m chi ti?t tr¨¬nh duy?t c?a b?n¡ªuser-agent, c¨¤i ??t TLS, b?t c? th? g¨¬ b?n ??t t¨ºn. N?u n¨® ng?i th?y m¨´i t? ??ng h¨®a, b?n s? b? n??ng ch¨ªn.
K?t qu? l¨¤ g¨¬? Tr¨¬nh thu th?p d? li?u c?a b?n ho?c l¨¤ ng?ng ho?t ??ng, ho?c cung c?p d? li?u kh?ng ??y ??, ho?c IP c?a b?n b? ??a v¨¤o danh s¨¢ch ?en. T?i ?? c¨® nh?ng d? ¨¢n m¨¤ t?i m?t h¨¤ng gi? v¨¬ ?i?u n¨¤y¡ªnh?ng gi? m¨¤ t?i mu?n d¨¤nh th?i gian u?ng c¨¤ ph¨º h?n l¨¤ kh?c ph?c s? c?. V?y, l¨¤m th? n¨¤o ?? ch¨²ng ta ch?ng tr?? H?y c¨´ng t¨¬m hi?u c¨¢c gi?i ph¨¢p.
C¨¢c chi?n l??c hi?u qu? ?? b? qua Th? th¨¢ch JS c?a Cloudflare
Tin t?t: b?n c¨® nhi?u l?a ch?n. D??i ??y l¨¤ ba c¨¢ch ch?c ch?n ?? v??t qua b?c t??ng Cloudflare ?¨®, m?i c¨¢ch ??u c¨® h??ng v? ri¨ºng.
1. Tr¨¬nh duy?t kh?ng ??u v?i m?t ch¨²t bi?n t?u
B?n ?? bao gi? nghe n¨®i v? c¨¢c c?ng c? nh? Selenium ho?c Puppeteer ch?a? Ch¨²ng gi?ng nh? nh?ng ??c v? b¨ª m?t c?a tr¨¬nh thu th?p d? li?u, gi? v? l¨¤ tr¨¬nh duy?t th?c b?ng c¨¢ch ch?y JavaScript. Th¨ºm ch? ?? ?n danh¡ªnh? v?i SeleniumBase¡ªv¨¤ b?n s? tr¨¢nh ???c c¨¢c th? thu?t ph¨¢t hi?n c?a Cloudflare. D??i ??y l¨¤ m?t ch¨²t h??ng v? trong Python:
python
from seleniumbase import SB
with SB(uc=True, headless=True) as sb:
sb.open("https://target-site.com")
# Thu th?p d? li?u!
?u ?i?m: Tuy?t v?i cho c¨¢c c?ng vi?c nh?; b?n ?ang ? v? tr¨ª ng??i l¨¢i.
Nh??c ?i?m: Ch?m nh? m?t m¨ªa ??i v?i c¨¢c c?ng vi?c l?n v¨¤ ti¨ºu t?n t¨¤i nguy¨ºn.
2. D?ch v? thu th?p d? li?u ??n gi?i c?u
N?u b?n mu?n ng??i kh¨¢c x? l? m? h?n ??n n¨¤y, c¨¢c d?ch v? nh? Web Unblocker ch¨ªnh l¨¤ t?m v¨¦ VIP c?a b?n. Ch¨²ng lu?n phi¨ºn proxy, hi?n th? JavaScript v¨¤ gi? cho Cloudflare h¨¤i l¨°ng trong khi b?n nh?m nhi t¨¢ch c¨¤ ph¨º m¨¤ t?i ?? ?? c?p. Ch? c?n g?i m?t y¨ºu c?u, l?y HTML v¨¤ thu th?p d? li?u.
?u ?i?m: S? ??n gi?n plug-and-play.
Nh??c ?i?m: V¨ª ti?n c?a b?n c¨® th? c?m th?y n¨® trong c¨¢c d? ¨¢n quy m? l?n.
3. CapSolver: K? ti¨ºu di?t CAPTCHA
B?y gi?, ??y l¨¤ l¨²c m?i chuy?n tr? n¨ºn th¨² v?. CapSolver l¨¤ m?t s?c m?nh ???c x?y d?ng ?? gi?i quy?t CAPTCHA v¨¤ c¨¢c th? th¨¢ch nh? Th? th¨¢ch JS c?a Cloudflare. N¨® c¨® m?t API ph¨´ h?p v?i c¨¢c script c?a b?n, gi?i quy?t th? th¨¢ch nhanh h?n b?n c¨® th? n¨®i "trang trung gian". Ch¨²ng ta s? t¨¬m hi?u s?u h?n v? vi¨ºn ng?c n¨¤y sau, nh?ng tin t?i ?i¡ªn¨® l¨¤ c?u tinh.
B?n ?ang g?p kh¨® kh?n v?i vi?c li¨ºn t?c th?t b?i trong vi?c gi?i quy?t ho¨¤n to¨¤n c¨¢c captcha khi thu th?p d? li?u web? Nh?n M? th??ng c?a b?n cho c¨¢c gi?i ph¨¢p captcha h¨¤ng ??u - CapSolver: CLOUD. Sau khi ??i, b?n s? nh?n ???c th¨ºm 5% ti?n th??ng sau m?i l?n n?p ti?n, kh?ng gi?i h?n
T?n d?ng CapSolver ?? chinh ph?c Th? th¨¢ch JS c?a Cloudflare
CapSolver l¨¤ l?a ch?n h¨¤ng ??u c?a t?i khi Cloudflare tung ra nh?ng qu? b¨®ng cong. N¨® s? d?ng AI th?ng minh ?? ph¨¢ v? Th? th¨¢ch JS (c¨°n g?i l¨¤ Th? th¨¢ch Cloudflare 5s) v¨¤ cung c?p cho b?n m?i th? b?n c?n¡ªcookie, ti¨ºu ??, token¡ª?? v??t qua d? d¨¤ng. D??i ??y l¨¤ n?i dung ch¨ªnh:
- G?i nhi?m v?: Truy c?p API c?a CapSolver v?i URL trang web v¨¤ c¨® th? l¨¤ m?t proxy.
- L?y gi?i ph¨¢p: CapSolver th?c hi?n ph¨¦p thu?t c?a n¨® v¨¤ g?i l?i h¨¤ng h¨®a.
- Thu th?p d? li?u: C?m c¨¢c chi ti?t ?¨® v¨¤o c¨¢c y¨ºu c?u c?a b?n, v¨¤ b?n ?? ho¨¤n th¨¤nh.
T¨ªch h?p Python
python
import requests
import time
CAPSOLVER_API_KEY = "Your_API_Key_Here"
SITE_URL = "https://target-site.com"
def solve_cloudflare_challenge():
url = "https://api.capsolver.com/createTask"
task = {
"type": "AntiCloudflareTask",
"websiteURL": SITE_URL,
"proxy": "http://username:password@proxyhost:port" # Tu? ch?n
}
payload = {"clientKey": CAPSOLVER_API_KEY, "task": task}
response = requests.post(url, json=payload).json()
task_id = response.get("taskId")
# Ch? gi?i ph¨¢p
while True:
result_url = "https://api.capsolver.com/getTaskResult"
result_payload = {"clientKey": CAPSOLVER_API_KEY, "taskId": task_id}
result = requests.post(result_url, json=result_payload).json()
if result["status"] == "ready":
return result["solution"]
elif result["status"] == "failed":
raise Exception("Gi?i quy?t th? th¨¢ch th?t b?i!")
time.sleep(2)
# S? d?ng n¨®
solution = solve_cloudflare_challenge()
headers = solution["headers"]
cookies = solution["cookies"]
# Th¨ºm ch¨²ng v¨¤o requests.get() c?a b?n ho?c b?t c? th? g¨¬ b?n ?ang s? d?ng
T¨ªch h?p Go
go
package main
import (
"bytes"
"encoding/json"
"fmt"
"net/http"
"time"
)
const (
apiKey = "Your_API_Key_Here"
siteURL = "https://target-site.com"
)
func solveCloudflareChallenge() (map[string]interface{}, error) {
url := "https://api.capsolver.com/createTask"
task := map[string]interface{}{
"type": "AntiCloudflareTask",
"websiteURL": siteURL,
"proxy": "http://username:password@proxyhost:port", // Tu? ch?n
}
payload := map[string]interface{}{"clientKey": apiKey, "task": task}
jsonData, _ := json.Marshal(payload)
resp, err := http.Post(url, "application/json", bytes.NewBuffer(jsonData))
if err != nil {
return nil, err
}
defer resp.Body.Close()
var result map[string]interface{}
json.NewDecoder(resp.Body).Decode(&result)
taskID := result["taskId"].(string)
// L?y k?t qu?
for {
resultURL := "https://api.capsolver.com/getTaskResult"
resultPayload := map[string]string{"clientKey": apiKey, "taskId": taskID}
jsonResult, _ := json.Marshal(resultPayload)
resultResp, err := http.Post(resultURL, "application/json", bytes.NewBuffer(jsonResult))
if err != nil {
return nil, err
}
defer resultResp.Body.Close()
var taskResult map[string]interface{}
json.NewDecoder(resultResp.Body).Decode(&taskResult)
if taskResult["status"] == "ready" {
return taskResult["solution"].(map[string]interface{}), nil
} else if taskResult["status"] == "failed" {
return nil, fmt.Errorf("Gi?i quy?t th? th¨¢ch th?t b?i")
}
time.Sleep(2 * time.Second)
}
}
func main() {
solution, err := solveCloudflareChallenge()
if err != nil {
fmt.Println("L?i:", err)
return
}
fmt.Println("Gi?i ph¨¢p s?n s¨¤ng:", solution)
}
M?o chuy¨ºn nghi?p: Tr¨¢nh nh?ng ?i?u kh¨® ch?u
CapSolver r?t tuy?t v?i, nh?ng b?n ph?i ch?i kh?n ngoan:
- T¨ªnh nh?t qu¨¢n c?a Proxy: S? d?ng c¨´ng m?t proxy ?? gi?i quy?t v¨¤ thu th?p d? li?u, n?u kh?ng Cloudflare s? nh¨¬n ch?m ch?m v¨¤o b?n.
- Kh?p User-Agent: Gi? cho user-agent c?a tr¨¬nh thu th?p d? li?u kh?p v?i gi?i ph¨¢p c?a CapSolver.
- Kh?ng kh¨ª TLS: Cloudflare ki?m tra d?u v?n tay TLS. S? d?ng m?t th? vi?n nh?
curl_cffi
trong Python ?? gi? cho m?i th? h?p l?.
C?u h?i th??ng g?p: Nh?ng c?u h?i ?ang ch¨¢y b?ng c?a b?n ?? ???c tr? l?i
S? kh¨¢c bi?t gi?a Th? th¨¢ch JS c?a Cloudflare v¨¤ Turnstile l¨¤ g¨¬?
Th? th¨¢ch JS l¨¤ m?t b¨¤i ki?m tra JavaScript nhanh ch¨®ng ?? lo?i b? bot¡ªh?y ngh? v? n¨® nh? m?t c¨¢i b?t tay. Turnstile l¨¤ ??a tr? m?i h?n, m?t CAPTCHA v? h¨¬nh c¨°n tinh ranh h?n. C? hai ??u gh¨¦t bot, nh?ng Turnstile th¨¬ ti¨ºn ti?n h?n.
T?i c¨® th? b? qua Th? th¨¢ch JS c?a Cloudflare m¨¤ kh?ng c?n d?ch v? kh?ng?
Ch?c ch?n r?i, n?u b?n l¨¤ m?t ninja. Tr¨¬nh duy?t kh?ng ??u v?i c¨¢c ch?nh s?a b¨ª m?t c¨® th? l¨¤m ???c ?i?u ?¨®, nh?ng b?n s? m?t nhi?u th?i gian ?? tinh ch?nh v¨¤ n¨¦ tr¨¢nh c¨¢c c?p nh?t c?a Cloudflare. C¨¢c d?ch v? nh? CapSolver gi¨²p b?n tr¨¢nh ???c nh?ng r?c r?i ?¨®.
CapSolver nhanh nh? th? n¨¤o trong vi?c gi?i quy?t Th? th¨¢ch JS?
Kh¨¢ nhanh¡ªth??ng ch? m?t v¨¤i gi?y, t¨´y thu?c v¨¤o trang web. N¨® ???c x?y d?ng ?? c¨® t?c ?? v¨¤ quy m?.
Suy ngh? cu?i c¨´ng
Th? th¨¢ch JS c?a Cloudflare kh?ng nh?t thi?t ph?i ph¨¢ h?ng tr¨° ch?i thu th?p d? li?u c?a b?n. Cho d¨´ b?n ?ang s? d?ng tr¨¬nh duy?t kh?ng ??u, d?a v¨¤o d?ch v? nh? Web Unblocker, hay h?p t¨¢c v?i CapSolver, b?n ??u c¨® c?ng c? ?? ??t ph¨¢. C¨¢ nh?n t?i, t?i r?t th¨ªch CapSolver¡ªn¨® gi?ng nh? c¨® m?t ng??i b?n ??ng h¨¤nh ?¨¢ng tin c?y x? l? c?ng vi?c n?ng nh?c trong khi t?i t?p trung v¨¤o nh?ng ?i?u th¨² v?.
Tuy¨ºn b? Tu?n th?: Th?ng tin ???c cung c?p tr¨ºn blog n¨¤y ch? mang t¨ªnh ch?t tham kh?o. CapSolver cam k?t tu?n th? t?t c? c¨¢c lu?t v¨¤ quy ??nh hi?n h¨¤nh. Vi?c s? d?ng m?ng l??i CapSolver cho c¨¢c ho?t ??ng b?t h?p ph¨¢p, gian l?n ho?c l?m d?ng l¨¤ ho¨¤n to¨¤n b? c?m v¨¤ s? b? ?i?u tra. C¨¢c gi?i ph¨¢p gi?i captcha c?a ch¨²ng t?i n?ng cao tr?i nghi?m ng??i d¨´ng trong khi ??m b?o tu?n th? 100% trong vi?c gi¨²p gi?i quy?t c¨¢c kh¨® kh?n v? captcha trong qu¨¢ tr¨¬nh thu th?p d? li?u c?ng khai. Ch¨²ng t?i khuy?n kh¨ªch vi?c s? d?ng d?ch v? c?a ch¨²ng t?i m?t c¨¢ch c¨® tr¨¢ch nhi?m. ?? bi?t th¨ºm th?ng tin, vui l¨°ng truy c?p ?i?u kho?n D?ch v? v¨¤ Ch¨ªnh s¨¢ch Quy?n ri¨ºng t?.
Th¨ºm

C¨¢ch gi?i quy?t th? th¨¢ch Cloudflare
V??t qua th? th¨¢ch Cloudflare d? d¨¤ng v?i CapSolver. H??ng d?n n¨¤y bao g?m nh?ng ?i?u c?n thi?t ?? gi?i quy?t b?o m?t c?a Cloudflare, ??m b?o ?i?u h??ng th¨¤nh c?ng v?i c¨¢c b??c v¨¤ l?i khuy¨ºn chi ti?t.

Anh Tuan
23-Sep-2025

C¨¢ch gi?i quy?t th? th¨¢ch Cloudflare JS ?? thu th?p d? li?u web v¨¤ t? ??ng h¨®a
T¨¬m hi?u c¨¢ch gi?i quy?t th? th¨¢ch JavaScript c?a Cloudflare ?? thu th?p d? li?u web v¨¤ t? ??ng h¨®a li?n m?ch. Kh¨¢m ph¨¢ c¨¢c chi?n l??c hi?u qu?, bao g?m s? d?ng tr¨¬nh duy?t kh?ng ??u, lu?n phi¨ºn proxy, v¨¤ t?n d?ng kh? n?ng gi?i quy?t CAPTCHA n?ng cao c?a CapSolver.

Anh Tuan
05-Mar-2025

D?u v?n tay TLS c?a Cloudflare: N¨® l¨¤ g¨¬ v¨¤ c¨¢ch gi?i quy?t
T¨¬m hi?u v? vi?c Cloudflare s? d?ng d?u v?n tay TLS ?? b?o m?t, c¨¢ch n¨® ph¨¢t hi?n v¨¤ ch?n bot, v¨¤ kh¨¢m ph¨¢ c¨¢c ph??ng ph¨¢p hi?u qu? ?? gi?i quy?t v?n ?? n¨¤y cho c¨¢c t¨¢c v? thu th?p d? li?u web v¨¤ duy?t web t? ??ng.

Anh Tuan
28-Feb-2025

C¨¢ch tr¨ªch xu?t d? li?u t? trang web ???c b?o v? b?i Cloudflare
Trong h??ng d?n n¨¤y, ch¨²ng ta s? kh¨¢m ph¨¢ c¨¢c k? thu?t ??o ??c v¨¤ hi?u qu? ?? tr¨ªch xu?t d? li?u t? c¨¢c trang web ???c b?o v? b?i Cloudflare.

Anh Tuan
20-Feb-2025

C¨¢ch gi?i quy?t Cloudflare b?ng Python v¨¤ Go v¨¤o n?m 2025
S? chia s? nh?ng hi?u bi?t v? Cloudflare Turnstile, s? d?ng Python v¨¤ Go cho nh?ng t¨¢c v? n¨¤y, li?u Turnstile c¨® th? ph¨¢t hi?n scraper Python, v¨¤ c¨¢ch v??t qua n¨® m?t c¨¢ch hi?u qu? b?ng c¨¢c gi?i ph¨¢p nh? CapSolver.

Anh Tuan
05-Nov-2024

C¨¢ch gi?i quy?t Captcha Turnstile c?a Cloudflare b?ng Selenium
Trong blog n¨¤y, ch¨²ng ta s? th?o lu?n v? m?t s? k? thu?t hi?u qu? ?? v??t qua Cloudflare Turnstile Captchas b?ng Selenium.

Anh Tuan
11-Oct-2024