python3-anticaptcha/python3_anticaptcha/SquareNetTextTask.py

377 lines
23 KiB
Python
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

import time
import asyncio
import hashlib
import os
import base64
import requests
import aiohttp
from python3_anticaptcha import create_task_url, app_key, get_sync_result, get_async_result, \
ParamError, ReadError
class SquareNetTextTask:
'''
Данный метод подходит для решения капчи-изображение.
Подробней информацию смотрите в методе 'captcha_handler' и '__init__'
'''
def __init__(self, anticaptcha_key: str, sleep_time: int = 5, save_format: str = 'temp', callbackUrl: str = None):
'''
Инициализация нужных переменных, создание папки для изображений и кэша
После завершения работы - удаляются временные фалйы и папки
:param anticaptcha_key: АПИ ключ капчи из кабинета пользователя
:param sleep_time: Вермя ожидания решения капчи
:param save_format: Формат в котором будет сохраняться изображение, либо как временный файл - 'temp',
либо как обычное изображение в папку созданную библиотекой - 'const'.
:param callbackUrl: URL для решения капчи с ответом через callback
'''
if sleep_time < 5:
raise ValueError(f'Параметр `sleep_time` должен быть не менее 5. Вы передали - {sleep_time}')
self.sleep_time = sleep_time
# проверяем переданный параметр способа сохранения капчи
if save_format in ['const', 'temp']:
self.save_format = save_format
else:
raise ValueError('\nПередан неверный формат сохранения файла изображения. '
f'\n\tВозможные варинты: `temp` и `const`. Вы передали - `{save_format}`'
'\nWrong `save_format` parameter. Valid params: `const` or `temp`.'
f'\n\tYour param - `{save_format}`')
# Пайлоад для создания задачи
self.task_payload = {"clientKey": anticaptcha_key,
"task":
{
"type": "SquareNetTask",
},
"softId": app_key
}
# задаём callbackUrl если передан
if callbackUrl:
self.task_payload.update({'callbackUrl': callbackUrl})
# отправляем запрос на результат решения капчи, если ещё капча не решена - ожидаем 5 сек
# если всё ок - идём дальше
self.result_payload = {"clientKey": anticaptcha_key}
def __enter__(self):
return self
def __exit__(self, exc_type, exc_value, traceback):
if exc_type:
return False
return True
def __image_temp_saver(self, content: bytes):
'''
Метод сохраняет файл изображения как временный и отправляет его сразу на сервер для расшифровки.
:return: Возвращает ID капчи
'''
# Создаём пайлоад, вводим ключ от сайта, выбираем метод ПОСТ и ждём ответа в JSON-формате
self.task_payload['task'].update({"body": base64.b64encode(content).decode('utf-8')})
# Отправляем на рукапча изображение капчи и другие парметры,
# в результате получаем JSON ответ с номером решаемой капчи и получая ответ - извлекаем номер
captcha_id = requests.post(create_task_url, json = self.task_payload).json()
return captcha_id
def __image_const_saver(self, content: bytes):
'''
Метод создаёт папку и сохраняет в неё изображение, затем передаёт его на расшифровку и удалет файл.
:return: Возвращает ID капчи
'''
img_path = 'PythonAntiCaptchaImages'
if not os.path.exists(img_path):
os.mkdir(img_path)
# Высчитываем хэш изображения, для того что бы сохранить его под уникальным именем
image_hash = hashlib.sha224(content).hexdigest()
with open(os.path.join(img_path, 'im-{0}.png'.format(image_hash)), 'wb') as out_image:
out_image.write(content)
with open(os.path.join(img_path, 'im-{0}.png'.format(image_hash)), 'rb') as captcha_image:
# Добавляем в пайлоад картинку и отправляем
self.task_payload['task'].update({"body": base64.b64encode(captcha_image.read()).decode('utf-8')})
# Отправляем на антикапча изображение капчи и другие парметры,
# в результате получаем JSON ответ содержащий номер решаемой капчи
captcha_id = requests.post(create_task_url, json = self.task_payload).json()
# удаляем файл капчи
os.remove(os.path.join(img_path, "im-{0}.png".format(image_hash)))
return captcha_id
def __read_captcha_image_file(self, content: bytes, content_type: str = "file"):
"""
Функция отвечает за чтение уже сохранённого файла или файла в уодировке base64
:param content: Параметр строка-путь указывающий на изображение капчи для отправки её на сервер
:param content_type: Тип переданной переменной. Возможны варианты: `file` и `base64`
:return: Возвращает ID капчи
"""
try:
if content_type == "file":
with open(content, 'rb') as captcha_image:
# Добавляем в пайлоад картинку и отправляем
self.task_payload['task'].update({"body": base64.b64encode(captcha_image.read()).decode('utf-8')})
elif content_type == "base64":
self.task_payload["task"].update({"body": content})
else:
raise ValueError('\nПередан неверный формат файла.'
f'\n\tВозможные варинты: `file` и `base64`. Вы передали - `{content_type}`'
f'\nWrong `content_type` parameter. Valid params: `file` or `base64`.'
f'\n\tYour param - `{content_type}`')
# Отправляем на антикапча изображение капчи и другие парметры,
# в результате получаем JSON ответ содержащий номер решаемой капчи
captcha_id = requests.post(create_task_url, json=self.task_payload).json()
except (IOError, FileNotFoundError) as err:
raise ReadError(err)
return captcha_id
# Работа с капчёй
def captcha_handler(self, objectName: str, rowsCount: int, columnsCount:int, image_link: str = None, image_file: str = None, image_base64: str = None):
'''
Этот тип задачи берет вашу картинку, добавляет на нее сетку нужного размера и отдает работнику с требованием выбрать объекты нужного типа.
:param objectName: Имя объекта.
:param rowsCount: Кол-во строк. Min 2, max 5
:param columnsCount: Кол-во колонок. Min 2, max 5
:param image_link: Ссылка на изображение
:param image_file: Необязательный параметр, служит для открытия уже скачанных файлов изображений.
:param image_base64: Загрузка изображения в кодировке base64
:return: Возвращает весь ответ сервера JSON-строкой.
'''
# проверка параметров сетки
if not 2<=rowsCount<=5 or not 2<=columnsCount<=5:
raise ValueError('Параметр `rowsCount` и `columnsCount` должен быть больше 2 и меньше 5.'
f'Вы передали - `rowsCount`:{rowsCount}, `columnsCount`:{columnsCount}')
# обновляем task_payload новыми данными для сетки разметки и названия предмета
self.task_payload['task'].update({"objectName": objectName})
self.task_payload['task'].update({"rowsCount": rowsCount})
self.task_payload['task'].update({"columnsCount": columnsCount})
# проводим действия над файлом(декодируем и передаём на сервер)
if image_file:
captcha_id = self.__read_captcha_image_file(image_file, content_type="file")
# проводим действия над файлом уже закодированном в base64(передаём на сервер)
elif image_base64:
captcha_id = self.__read_captcha_image_file(image_base64, content_type="base64")
# проводим действия над ссылкой на файл(скачиваем, сохраняем и передаём на сервер)
elif image_link:
content = requests.get(image_link).content
# согласно значения переданного параметра выбираем функцию для сохранения изображения
if self.save_format == 'const':
captcha_id = self.__image_const_saver(content)
elif self.save_format == 'temp':
captcha_id = self.__image_temp_saver(content)
else:
raise ParamError(additional_info="""You must set one of param - `image_file/image_base64/image_link`.\n
Вы должны задать один из параметров - `image_file/image_base64/image_link`.""")
# Проверка статуса создания задачи, если создано без ошибок - извлекаем ID задачи, иначе возвращаем ответ сервера
if captcha_id['errorId'] == 0:
captcha_id = captcha_id["taskId"]
self.result_payload.update({"taskId": captcha_id})
else:
return captcha_id
# если передан параметр `callbackUrl` - не ждём решения капчи а возвращаем незаполненный ответ
if self.task_payload.get('callbackUrl'):
return self.result_payload
else:
# Ожидаем решения капчи
time.sleep(self.sleep_time)
return get_sync_result(result_payload = self.result_payload, sleep_time = self.sleep_time)
class aioSquareNetTextTask:
'''
Данный метод подходит для всинхронного решения капчи-изображение.
Подробней информацию смотрите в методе 'captcha_handler' и '__init__'
'''
def __init__(self, anticaptcha_key: str, sleep_time: int = 5, save_format: str = 'temp', callbackUrl: str = None):
'''
Инициализация нужных переменных, создание папки для изображений и кэша
После завершения работы - удаляются временные фалйы и папки
:param anticaptcha_key: АПИ ключ капчи из кабинета пользователя
:param sleep_time: Вермя ожидания решения капчи
:param save_format: Формат в котором будет сохраняться изображение, либо как временный файл - 'temp',
либо как обычное изображение в папку созданную библиотекой - 'const'.
:param callbackUrl: URL для решения капчи с ответом через callback
'''
if sleep_time < 5:
raise ValueError(f'Параметр `sleep_time` должен быть не менее 5. Вы передали - {sleep_time}')
self.sleep_time = sleep_time
# проверяем переданный параметр способа сохранения капчи
if save_format in ['const', 'temp']:
self.save_format = save_format
else:
raise ValueError('\nПередан неверный формат сохранения файла изображения. '
f'\n\tВозможные варинты: `temp` и `const`. Вы передали - `{save_format}`'
'\nWrong `save_format` parameter. Valid params: `const` or `temp`.'
f'\n\tYour param - `{save_format}`')
# Пайлоад для создания задачи
self.task_payload = {"clientKey": anticaptcha_key,
"task":
{
"type": "SquareNetTask",
},
"softId": app_key
}
# задаём callbackUrl если передан
if callbackUrl:
self.task_payload.update({'callbackUrl': callbackUrl})
# отправляем запрос на результат решения капчи, если ещё капча не решена - ожидаем 5 сек
# если всё ок - идём дальше
self.result_payload = {"clientKey": anticaptcha_key}
def __enter__(self):
return self
def __exit__(self, exc_type, exc_value, traceback):
if exc_type:
return False
return True
async def __image_temp_saver(self, captcha_link: str):
'''
Метод сохраняет файл изображения как временный и отправляет его сразу на сервер для расшифровки.
:return: Возвращает ID капчи
'''
# Скачиваем капчу
async with aiohttp.ClientSession() as session:
async with session.get(captcha_link) as resp:
content = await resp.content.readany()
# Создаём пайлоад, вводим ключ от сайта, выбираем метод ПОСТ и ждём ответа в JSON-формате
self.task_payload['task'].update({"body": base64.b64encode(content).decode('utf-8')})
# Отправляем на рукапча изображение капчи и другие парметры,
# в результате получаем JSON ответ с номером решаемой капчи
async with aiohttp.ClientSession() as session:
async with session.post(create_task_url, json=self.task_payload) as resp:
return await resp.json()
async def __image_const_saver(self, captcha_link: str):
'''
Метод создаёт папку и сохраняет в неё изображение, затем передаёт его на расшифровку и удалет файл.
:return: Возвращает ID капчи
'''
img_path = 'PythonAntiCaptchaImages'
if not os.path.exists(img_path):
os.mkdir(img_path)
# Скачиваем капчу
async with aiohttp.ClientSession() as session:
async with session.get(captcha_link) as resp:
content = await resp.content.readany()
# Высчитываем хэш изображения, для того что бы сохранить его под уникальным именем
image_hash = hashlib.sha224(content).hexdigest()
with open(os.path.join(img_path, 'im-{0}.png'.format(image_hash)), 'wb') as out_image:
out_image.write(content)
with open(os.path.join(img_path, 'im-{0}.png'.format(image_hash)), 'rb') as captcha_image:
# Добавляем в пайлоад картинку и отправляем
self.task_payload['task'].update({"body": base64.b64encode(captcha_image.read()).decode('utf-8')})
# Отправляем на антикапча изображение капчи и другие парметры,
# в результате получаем JSON ответ содержащий номер решаемой капчи
async with aiohttp.ClientSession() as session:
async with session.post(create_task_url, json=self.task_payload) as resp:
captcha_id = await resp.json()
# удаляем файл капчи
os.remove(os.path.join(img_path, "im-{0}.png".format(image_hash)))
return captcha_id
async def __read_captcha_image_file(self, content: bytes, content_type: str = 'file'):
"""
Функция отвечает за чтение уже сохранённого файла или файла в уодировке base64
:param content: Параметр строка-путь указывающий на изображение капчи для отправки её на сервер
:param content_type: Тип переданной переменной. Возможны варианты: `file` и `base64`
:return: Возвращает ID капчи
"""
try:
if content_type == "file":
with open(content, 'rb') as captcha_image:
# Добавляем в пайлоад картинку и отправляем
self.task_payload['task'].update({"body": base64.b64encode(captcha_image.read()).decode('utf-8')})
elif content_type == "base64":
self.task_payload["task"].update({"body": content})
else:
raise ValueError('\nПередан неверный формат файла.'
f'\n\tВозможные варинты: `file` и `base64`. Вы передали - `{content_type}`'
f'\nWrong `content_type` parameter. Valid params: `file` or `base64`.'
f'\n\tYour param - `{content_type}`')
# Отправляем на антикапча изображение капчи и другие парметры,
# в результате получаем JSON ответ содержащий номер решаемой капчи
captcha_id = requests.post(create_task_url, json = self.task_payload).json()
except (IOError, FileNotFoundError) as err:
raise ReadError(err)
return captcha_id
# Работа с капчёй
async def captcha_handler(self, objectName: str, rowsCount: int, columnsCount:int, image_link: str = None, image_file: str = None, image_base64: str = None):
'''
Этот тип задачи берет вашу картинку, добавляет на нее сетку нужного размера и отдает работнику с требованием выбрать объекты нужного типа.
:param objectName: Имя объекта.
:param rowsCount: Кол-во строк. Min 2, max 5
:param columnsCount: Кол-во колонок. Min 2, max 5
:param image_link: Ссылка на изображение
:param image_file: Необязательный параметр, служит для открытия уже скачанных файлов изображений.
:param image_base64: Загрузка изображения в кодировке base64
:return: Возвращает весь ответ сервера JSON-строкой.
'''
# проверка параметров сетки
if (2<rowsCount<5) and (2<columnsCount<5):
raise ValueError('Параметр `rowsCount` и `columnsCount` должен быть больше 2 и меньше 5.'
f'Вы передали - `rowsCount`:{rowsCount}, `columnsCount`:{columnsCount}')
# обновляем task_payload новыми данными для сетки разметки и названия предмета
self.task_payload['task'].update({"objectName": objectName})
self.task_payload['task'].update({"rowsCount": rowsCount})
self.task_payload['task'].update({"columnsCount": columnsCount})
# если был передан линк на локальный скачаный файл
if image_file:
captcha_id = await self.__read_captcha_image_file(image_file, content_type="file")
elif image_base64:
captcha_id = await self.__read_captcha_image_file(image_base64, content_type="base64")
elif image_link:
# согласно значения переданного параметра выбираем функцию для сохранения изображения
if self.save_format == 'const':
captcha_id = await self.__image_const_saver(image_link)
elif self.save_format == 'temp':
captcha_id = await self.__image_temp_saver(image_link)
else:
raise ParamError(additional_info="""You must set one of param - `image_file/image_base64/image_link`.\n
Вы должны задать один из параметров - `image_file/image_base64/image_link`.""")
# Проверка статуса создания задачи, если создано без ошибок - извлекаем ID задачи, иначе возвращаем ответ сервера
if captcha_id['errorId'] == 0:
captcha_id = captcha_id["taskId"]
self.result_payload.update({"taskId": captcha_id})
else:
return captcha_id
# если передан параметр `callbackUrl` - не ждём решения капчи а возвращаем незаполненный ответ
if self.task_payload.get('callbackUrl'):
return self.result_payload
else:
# Ждем решения капчи
await asyncio.sleep(self.sleep_time)
return await get_async_result(result_payload = self.result_payload, sleep_time = self.sleep_time)