Ярлыки

.htaccess (4) тестирование (8) шаблоны проектирования (3) css (5) Debian (6) docker (2) Doctrine2 (6) Git (6) html (4) java (6) javascript (13) jquery (11) LFS (3) linux (23) mac os (4) mod_rewrite (2) MSSQL (4) MySQL (18) ORM Doctrine (17) patterns (3) PDO (3) perl (7) PHP (64) PHPUnit (8) Python (15) SEO (2) Silex (1) SimpleXML (1) SQL (14) ssh (4) Ubuntu (24) Yii1 (1) Zend Framework (19) ZendFramework2 (8)

понедельник, 21 марта 2011 г.

Python. Работа со строками в utf-8.

Локализация системы (Ubuntu) - UTF-8. Во всех модулях указываем кодировку в начале файла:
# -*- coding: utf-8 -*- 

# Строка в кодировке windows-1251
str = ' привет '
# Кодируем в юникод
str = str.decode('windows-1251')

# strip - Удаляем начальный и завершающий пробел
# replace - Ищем и заменяем строку (u'' - строка в юникод)
# encode - кодируем в набор байт перед выводом на печать, в файл и тд
str = str.strip().replace(u'пр', '').encode('utf8')

'ивет'

Комментариев нет:

Отправить комментарий