May 4, 2011

Проблемы с отображением кириллицы | CyberSEO Pro | Support Forum

Avatar

Lost password?
Advanced Search

— Forum Scope —




— Match —





— Forum Options —





Minimum search word length is 3 characters - maximum search word length is 84 characters

sp_Related Related Topics sp_TopicIcon
Проблемы с отображением кириллицы
Topic Rating: 0 Topic Rating: 0 Topic Rating: 0 Topic Rating: 0 Topic Rating: 0 Topic Rating: 0 (0 votes) 
January 24, 2012
4:02 pm
Avatar
Cap
Guest
Guests

Есть фид, который тянет материал с русскоязычного ресурса. При добавлении в CyberSeo все парсится отлично, пытаюсь добавить часть статьи простеньким кодом

Login to see the code

контент выводится до первого символа кириллицы, начиная с этого символа и до самого конца больше ничего не выводится (даже если дальше есть латинские символы или html теги).

Думал проблема с кодировкой, но при подключении функции Convert character encoding вообще постов не появляется, то есть ничего не парсится.

Подскажите, пожалуйста, как победить эту проблему или в чем причина нежелания фида нормально отображаться. Может я где-то что-то не учел или допустил ошибку?

January 24, 2012
4:43 pm
Avatar
CyberSEO
Admin
Forum Posts: 3666
Member Since:
July 2, 2009
sp_UserOfflineSmall Offline

Для парсинга юникода надо пользоваться модификатором “u”, а не “U” (модификатор поиска минимального по длине соответствия).

January 24, 2012
9:06 pm
Avatar
Cap
Guest
Guests

При добавлении модификатора “u” ничего вообще не парсится, может быть проблема конечно в том, что фид в кодировке windows-1251, однако, сам плагин то его парсит правильно, без всяких кракозябров, а как я уже писал если включить Convert character encoding то вообще ни одного поста не добавляется.

Получается с модификатором  “u”, искомая строка не находится, с модификатором “U” находится, но не выводится. Пробовал ставить их вместе, но из-за “u” ничего не ищется. При этом если вставить подобный код с модификатором “U” напрямую на отдельной странице, все как надо парсится и отображается. Может быть у меня  ошибка еще в чем-то?

Вот например фид Login to see this link заключенное в первый тег <p></p>

January 25, 2012
1:52 pm
Avatar
CyberSEO
Admin
Forum Posts: 3666
Member Since:
July 2, 2009
sp_UserOfflineSmall Offline

Поскольку это не ошибка в плагине, помочь, к сожалению, ничем не могу.

January 25, 2012
4:25 pm
Avatar
Cap
Guest
Guests

Скажите пожалуйста, то есть вы считаете что конструкция 

1 $content = file_get_contents ($post ['link']);
2 preg_match('/<p>(.*)<\/p>/su',$content ,$matches);
3 $post ['post_content'] = $matches[1];

в данном случае должна нормально работать, а проблема заключается в чем-то другом?

January 25, 2012
5:26 pm
Avatar
CyberSEO
Admin
Forum Posts: 3666
Member Since:
July 2, 2009
sp_UserOfflineSmall Offline

Вы разве не заметили, что кодировка не та – ромбики какие-то вместо букв? Такой контент конечно же никуда не добавится.

Включать “Convert character encoding” бесполезно, т.к. эта опция обрабатывает контент фида, а не то что Вы там уже сами парсите из HTML файла. Перекодируйте содержимое переменной $content из Windows-1251 в UTF-8 и все будет работать, как надо.

Повторюсь еще раз – это не ошибка в плагине CyberSEO, а недоработка в Вашем собственном коде.

January 30, 2012
7:32 pm
Avatar
Cap
Guest
Guests

Спасибо за подсказку, проблема действительно была из-за того, что содержимое страницы парсилось в непонятном формате. Для тех, кто столкнулся с подобным простое решение, добавить второй строчкой 

$content= iconv ('windows-1251','UTF-8',$content );

и все будет отлично искаться и выводиться

Forum Timezone: Europe/Amsterdam

Most Users Ever Online: 541

Currently Online:
9 Guest(s)

Currently Browsing this Page:
1 Guest(s)

Top Posters:

ninja321: 84

s.baryshev.aoasp: 64

Freedom: 61

MediFormatica: 49

B8europe: 47

saviulisse67: 45

Member Stats:

Guest Posters: 338

Members: 2633

Moderators: 0

Admins: 1

Forum Stats:

Groups: 1

Forums: 4

Topics: 1529

Posts: 7735

Newest Members:

t.schleiser, worldnetsites, janodamek, socialbiz4themasses, suren.manvelyan.sv, Darick

Administrators: CyberSEO: 3666