html = '<div><span>hello</span><span>goodbay</span></div>'
# (?=...) - соотв, если ... соотв тому, что идет следом, но не включает ...
# (?<=...) - соотв, если ... предшествует искомой позиции, но не включает ...
# .*? - нежадный поиск, произвольная последовательность символов
# re.DOTALL - включить в поиск служебные символы (перенос строк, пробелы и тд)
match = re.search('(?<=<span>).*?(?=</span>)', html, re.DOTALL).group(0)
print match
'hello'
Поиск в строке с кодировкой utf-8
m = re.search('some string'.decode('utf-8'), 'some string and something else'.decode('utf-8'), re.UNICODE|re.IGNORECASE)
Комментариев нет:
Отправить комментарий