Для расшифровки ‘\u0442\u0435\u0441\u0442’:
>>> a = '\\u0442\\u0435\\u0441\\u0442'
>>> a.encode().decode('unicode-escape')
'тест'
Для расшифровки ‘\u0442\u0435\u0441\u0442’:
>>> a = '\\u0442\\u0435\\u0441\\u0442'
>>> a.encode().decode('unicode-escape')
'тест'
import base64
a = base64.b64encode(bytes(u’complex string: ñáéíóúÑ’, «utf-8»))
# a: b’Y29tcGxleCBzdHJpbmc6IMOxw6HDqcOtw7PDusOR’
b = base64.b64decode(a).decode(«utf-8», «ignore»)
print(b)
# b :complex string: ñáéíóúÑ
Скрипт читает в переменную содержимое html-страницы:
# -*- coding: utf-8 -*- import http.client import ssl print('Program started') #выполнить http-запрос print('Sending request to site...') #https://stackoverflow.com/questions/39945702/httplib-httpsconnection-issue-certificate-verify-failed#39945733 conn = http.client.HTTPSConnection('kmsvsr.ru', timeout=5, context=ssl._create_unverified_context()) conn.request("GET", "/") resp = conn.getresponse() print(resp.status, resp.reason) print('Reading answer...') data = resp.read().decode() print (data)
Скрипт не дописан, кто будет пользоваться — не забудьте добавить сюда обработку ошибок. А так по быстрому спарсить страницу пойдёт.
Из обобенностей: здесь в примере открывается сайт не по HTTP, а по HTTPS, при чём включен игнор ошибок, то есть код можно использовать для парсинга сайтов с самоподписанными сертификатами.