ORM Doctrine, PHP, SQL, Zend Framework, SEO для роботов-сгибальщиков: Python. Регулярные выражения. Нежадный поиск с учетом служебных символов.

вторник, 22 марта 2011 г.

Python. Регулярные выражения. Нежадный поиск с учетом служебных символов.

html = '<div><span>hello</span><span>goodbay</span></div>'

# (?=...) - соотв, если ... соотв тому, что идет следом, но не включает ...
# (?<=...) - соотв, если ... предшествует искомой позиции, но не включает ...
# .*? - нежадный поиск, произвольная последовательность символов
# re.DOTALL - включить в поиск служебные символы (перенос строк, пробелы и тд)

match = re.search('(?<=<span>).*?(?=</span>)', html, re.DOTALL).group(0)
print match
'hello'

Поиск в строке с кодировкой utf-8

m = re.search('some string'.decode('utf-8'), 'some string and something else'.decode('utf-8'), re.UNICODE|re.IGNORECASE)

ORM Doctrine, PHP, SQL, Zend Framework, SEO для роботов-сгибальщиков

Ярлыки

вторник, 22 марта 2011 г.

Python. Регулярные выражения. Нежадный поиск с учетом служебных символов.

Комментариев нет:

Отправить комментарий

Ярлыки

вторник, 22 марта 2011 г.

Python. Регулярные выражения. Нежадный поиск с учетом служебных символов.

Комментариев нет:

Отправить комментарий

вторник, 22 марта 2011 г.