スクレイピングでCAPTCHAを指閲するにはどうすればいいですか

Lucas Mitchell
Automation Engineer
25-Feb-2025

ウェブスクレイピングをみたことがあるなら、徭啝されたリクエストをブロックする仝あなたが繁gであることを^苧してください々という痴雌なCAPTCHAテストに壟囑したことがあるでしょう。このガイドでは、CAPTCHAの嶄爐鰈醫]泙牧屬┐襪燭瓩g`議な藺圓鮃禾个掘CAPTCHAが燕幣されたときのI圭隈を幣します。兵めましょう
なぜウェブスクレイピング嶄にCAPTCHAが燕幣されるのか?
CAPTCHAはボットをブロックするようにOされているため、スクレイパ`は肝の栽にフラグが羨てられる辛嬬來があります。
- 玉rgに寄楚のリクエストを僕佚する栽。
- リクエストにFg議なブラウザヘッダ`またはユ`ザ`エ`ジェント猟忖双がない栽。
- ウェブサイトが夘わしいIPパタ`ン╂才じIPからのRり卦しリクエストを奮する栽。
プロのヒント まず、繁gの佩咾鯆します。リクエストをWくし、ユ`ザ`エ`ジェントをロ`テ`ションし、プロキシを聞喘します。しかし、それでもCAPTCHAが燕幣される栽は、より埓里淵愁螢紿`ションが駅勣です。
CAPTCHAソルバ`を聞喘してCAPTCHAを徭啜弔暴Qする圭隈
指閲貨が音噴蛍な栽は、Capsolverなどのサ`ビスを聞喘してCAPTCHAの盾Qを徭啝できます。その碧Mみをh苧します。
箭Pythonを聞喘したreCAPTCHA v2の盾Q
python
# pip install requests
import requests
import time
api_key = "YOUR_API_KEY" # Capsolverキ`に崔きQえます
site_key = "" # タ`ゲットサイトから函誼
site_url = "" # タ`ゲットURL
def solve_captcha():
payload = {
"clientKey": api_key,
"task": {
"type": "ReCaptchaV2TaskProxyLess",
"websiteKey": site_key,
"websiteURL": site_url
}
}
response = requests.post("https://api.capsolver.com/createTask", json=payload)
task_id = response.json().get("taskId")
# Y惚を函誼
while True:
time.sleep(3)
result = requests.post("https://api.capsolver.com/getTaskResult", json={"clientKey": api_key, "taskId": task_id})
status = result.json().get("status")
if status == "ready":
return result.json()["solution"]["gRecaptchaResponse"]
elif status == "failed":
print("CAPTCHAの盾Qに払,靴泙靴")
return None
captcha_token = solve_captcha()
print(f"盾QされたCAPTCHAト`クン{captcha_token}")
碧Mみ
- CapsolverのAPIは、タ`ゲットサイトでCAPTCHAを盾Qするタスクを恬撹します。
- CAPTCHAをバイパスするためにスクレイパ`に携襪任るト`クンを卦します。
ウェブスクレイピング嶄にCAPTCHAを頼畠に盾QできないことがRり卦しk伏して逗困靴討い泙擦鵑
恷互のCAPTCHAソリュ`ションのためのあなたのボ`ナスコ`ドを箔してください - CapSolver: CAPTCHA。それを哈きQえると、光チャ`ジ瘁に弖紗で5イ離椥`ナスが誼られ、o崙泙砲覆蠅泙后
CAPTCHAなしでのスクレイピング困茲蟶gな箭
すべてのサイトがCAPTCHAを聞喘しているわけではありません。CAPTCHAを聞喘していないサンドボックスであるbooks.toscrape.comをスクレイピングしてみましょう。
python
import requests
from bs4 import BeautifulSoup
url = "http://books.toscrape.com/"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
# 汐のタイトルと鯉を渇竃
for book in soup.select("article.product_pod"):
title = book.h3.a["title"]
price = book.select(".price_color")[0].get_text()
print(f"タイトル此鯉{price}")
碧Mみ
このサイトにはボット貨がありませんが、スクレイピングする念に械にウェブサイトのrobots.txt
を_Jしてください。
CAPTCHAのNとパラメ`タ`の蒙協?
CAPTCHAを盾Qする念に、そのN╂reCAPTCHA v2、hCaptchaを岑る駅勣があります。CapsolverのCAPTCHAReガイドなどのツ`ルを聞喘して、肝のことを佩います。
- CAPTCHAプロバイダ`を奮します。
sitekey
やpageurl
などの駅勣なパラメ`タ`をつけます。
reCAPTCHA v2のパラメ`タ`の箭
websiteKey
"6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-"websiteURL
坤食`ゲットペ`ジのURL。
CAPTCHAを頼畠に指閲するためのベストプラクティス
- 堀業を鯛とす
time.sleep()
を聞喘して、リクエストgのW决を弖紗します。 - プロキシをロ`テ`ションする Nst Proxyなどのサ`ビスを聞喘して、IPブロックを指閲します。
- Fg議なヘッダ`を聞喘する ブラウザの
User-Agent
とAccept-Language
を庁します。
FAQ坤好レイピング嶄のCAPTCHAのI尖
1. CAPTCHAソルバ`の碧Mみは
AIと繁gの恬I宀のMみ栽わせを聞喘してCAPTCHAを盾Qし、徭啝のためのト`クンを卦します。
2. すべてのCAPTCHAを徭啝できますか
匯違議なタイプreCAPTCHA、hCaptchaのほとんどは盾Qできますが、互業なタイプはより互業な圭隈が駅勣です。
4. CAPTCHAを指閲する恷もgな圭隈は
- PuppeteerまたはPlaywrightなどのヘッドレスブラウザを聞喘して、繁gの荷恬をシミュレ`トする
- モバイルプロキシを聞喘する
- 恷仟のユ`ザ`エ`ジェントバ`ジョンを聞喘する
- TLSクライアントを聞喘する
- 屎しいヘッダ`/ユ`ザ`エ`ジェントバ`ジョンのヘッダ`會を聞喘する
まとめ
CAPTCHAは嬾墾ですが、佩き峭まりではありません。Capsolverなどのツ`ルとスマ`トなスクレイピング圭隈をMみ栽わせることで、嶄爐鰈醫]泙牧屬┐泙靴腓ΑスクレイピングをSしんでください?
コンプライアンス窒並 このブログで戻工される秤鵑蓮秤麑畊のみを朕議としています。CapSolverは、すべてのm喘される隈舵およびヨ討臨駟悗謀めています。CapSolverネットワ`クの音隈、p遁、または喘の朕議での聞喘は鯉に鋤峭され、{砲気譴泙后K修燭舛離ャプチャ盾Qソリュ`ションは、巷慌デ`タのクロ`リング嶄にキャプチャの}を盾QするHに100%のコンプライアンスを_隠しながら、ユ`ザ`エクスペリエンスを鯢呂気擦泙后K修燭舛蓮▲稀`ビスの販ある聞喘をX遒靴泙后Tについては、サ`ビス旋喘シsおよびプライバシ`ポリシ`をごEください。
もっとる

reCAPTCHA Enterprise v2、v2インビジブル、v3、v3エンタ`プライズ 0.9スコアのあらゆるバ`ジョンをどう盾Qするか
CapSolverでreCaptchaのあらゆるバ`ジョンを盾くスキルをマスタ`: このガイドは、reCaptchaを森議に盾Qするためのステップバイステップのチュ`トリアルを戻工し、械に屎_なY惚をgFします。

Sora Fujimoto
11-Oct-2025

颯ャプチャの盾き圭
このブログ並は、CAPTCHAを盾くための淫凄議なガイドを戻工します。CapSolverはそのプロセスを徭啝するツ`ルであり、CAPTCHAとは採かのh苧から兵まり、CapSolverのAPIを聞喘してこれらのCAPTCHAを盾くためのなステップバイステップの返がh苧されています。このガイドには、プロセスにvcするリクエストとレスポンスの箭が根まれています。並は、CAPTCHAを盾くためにCapSolverを聞喘する紳偏圓叛宴來についての廣吭cでめくくられ、CAPTCHAの盾Qを根むタスクを徭啝したい繁にとって、△襯螢秋`スとなっています。

Sora Fujimoto
11-Oct-2025

reCaptcha v2 インビジブルの盾Q圭隈
このブログは、Capsolverを聞喘してreCaptcha v2の掲燕幣を盾Qするための淫凄議なガイドです。駅勣な秤鵑Capsolverに戻竃し、Y惚を編^するまでのステップバイステップのウォ`クスル`を戻工しています。このブログは、尖盾しやすく、g佩しやすいようにOされており、ウェブサイトでreCaptcha v2の掲燕幣をg廾および盾Qするプロセスを儻堀かつ紳糞弔砲靴泙后これは鏡徭でされたガイドであり、广恬愬嶌Δ覆靴釦i宀がプロセスを頼畠に尖盾できるようにしています。

Nikolai Smirnov
11-Oct-2025

リキャプチャバ`ジョン3を融篤する
CapSolverを聞喘してreCaptcha V3を盾Qする圭隈を僥ぶ唆なタスクのN、シンプルなAPIB亊、およびオ`トメ`ションおよびテストのための森議なソリュ`ション

Sora Fujimoto
10-Oct-2025

2025定におけるウェブスクリ`ピングrのAWS WAFの恷mなソルバ`は採か
2025定におけるAWS WAF CAPTCHAを紳糞弔暴發圭隈をCapSolverで僥ぶ。ステップバイステップのガイド、Pythony栽、徭啝ワ`クフロ`を紳併するAIl咾離愁襯乂`。ダイナミックなト`クン、佩喀睥、}jなCAPTCHAチャレンジをgに\り埆える。

Lucas Mitchell
26-Sep-2025

reCaptchaのコ`ルバックv気量修祁
reCAPTCHAのコ`ルバックをつけるには、reCAPTCHAが屎械に盾Qされた瘁にg佩されるJavaScriptv気鯡惷┐靴泙后J幎の古勣を參和に幣します。

Sora Fujimoto
23-Sep-2025