Главная » Переезд Narod.ru » Общие вопросы » Массовая (пакетная) конвертация файлов из win1251 в utf8

Массовая (пакетная) конвертация файлов из win1251 в utf8

10.04.2013 в 20:30
Автор: stzarya

Если после переезда на сайте вы видите кракозябры (непонятные символы и знаки) вместо русского текста, то вероятней всего информация на страницах осталась в кодировке win1251. Веб-сервер uCoz отдает информацию в utf8, по-этому для решения вопроса потребуется конвертировать текст в нужную кодировку. 

Если требуется конвертировать много файлов, удобней  воспользоваться сторонним программным обеспечением.

1. Скачиваем все html и js (если есть) файлы на компьютер, используя FTP. На всякий случай, сделайте копию этого контента
2. Устанавливаем программу UTFCast Express. Это условно бесплатная программа, которая умеет конвертировать текст из разных кодировок в utf8. Доступна для ОС семейства Windows. 
3. Запускаем UTFCast Express и указываем правильные пути: сверху - что конвертировать, снизу - куда складывать конвертированные файлы. Вам нужно просто выбрать нужные директории, программа сама перекодирует все нужные файлы из папки.  Нажимаем "Start".


4. По завершение процесса, вы увидите какие файлы были конвертированы. 


Внимание! В HTML файле может быть принудительно указана кодировка. Проверьте, если есть такая строчка:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">

ее нужно заменить на следующую:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

5. Заливаем файлы обратно на сервер, с заменой, используя FTP. Проблема должна исчезнуть. 

Если не помогло, пожалуйста, напишите в комментариях с какой проблемой столкнулись. Попробуем решить. 

Рейтинг: -1  (помогла ли Вам эта инструкция: да / нет)          Просмотров: 44538          Комментариев: 22
02.11.2015 в 07:48      0  


Цитата
2. Устанавливаем программу UTFCast Express. Это условно бесплатная программа, которая умеет конвертировать текст из
разных кодировок в utf8. Доступна для ОС семейства Windows.
Есть хороший русский редактор AkelPad который всё сделает бесплатно. Правда у него есть ограничение на количество открываемых файлов в несколько сотен. Но это мелочь.


Цитата
Внимание! В HTML файле может быть принудительно указана кодировка. Проверьте, если есть такая строчка:
........
У меня на сайте есть бесплатная программа Поиск/Замена.
http://newjs.my1.ru/load/poisk_i_zamena_teksta/1-1-0-3
30.10.2013 в 17:43      0  

Доброе время суток. На сайте sadikalenka.narod.ru у меня так же проблема с кодировкой, попытался переконвертировать массово с помощью программы UTFCast Express, ничего не помогло, потом переписал строчку с windows-1251 на строчку utf-8, тоже ничего не изменилось. Подскажите, пожалуйста как исправить проблему.
01.11.2013 в 10:02      0  

Здравствуйте, -=1CEMEN=-.
Цитата
попытался переконвертировать массово с помощью программы UTFCast Express, ничего не помогло

Уточните, какие трудности возникли при совершении данного действия. Если данным ПО не удаётся выполнить желаемое, Вы можете воспользоваться иным ПО, указанным в рамках раздела: http://manual.ucoz.net/board/52
09.08.2013 в 03:46      0  

Спасибо, для перезда сайта на народе помогла!
01.06.2013 в 02:11      0  

решено
01.05.2013 в 12:04      0  

Добрый день!

Мой сайт: http://www.archivsf.narod.ru/index.htm
На нем имеется несколько тысяч html-страничек.
В МЕТА-тегах указана такая кодировка:
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">

И  естественно, что после переезда на них появились "квадратики".
Я выполнил все указанные действия с помощью программы UTFCast Express.
Но теперь одни вопросительные знаки и прочая белиберда.
 
Как перебить МЕТА-теги на нескольких тысяч страничек одним махом – не знаю. Согласитесь, что вручную это делать довольно долго и муторно. Чтобы не торопить события, я решил попробовать на одном файле.
 
Я перебил в заглавном файле index.htm МЕТА-тег:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

Закачал его на сервер, но ничего не произошло.

 

Т.е. как я понимаю, мною было сделано следующее:

1. Я переконвертировал все файлы с помощью UTFCast Express
2. Вручную заменил МЕТА-тег для распознавания страницы сервером
3. Следовательно, сделал всё то, что советовали.
Но если вы откроете заглавную страницу сайта: http://www.archivsf.narod.ru/index.htm,
картинка неприглядная.

Помогите пожалуйста моему горю.
Спасибо.



06.05.2013 в 15:22      0  

По факту текст сейчас на сайте в кодировке cp1251. 
Пожалуйста, напишите мне в почту popov@ucoz-team.net , попробуем разобраться.
04.09.2013 в 16:56      0  

Прежде всего, надо на всех страницах удалить строку с указанием кодировки (<meta http-equiv="Content-Type" content="text/html; charset=........>), оставив строку с указанием языка (<meta http-equiv="Content-Language" content="ru">)

Для массовой перекодировки я использую бесплатную программу DeniSoft text Converter http://conv.denisoft.ru/DStC.zip

Для массовых изменений в текстах страниц - APE Utilities for the web designer (тоже бесплатная) http://www.rvsn2.narod.ru/soft36.htm

Алгоритм действий для изменения на нескольких тысячах страниц какого-нибудь текста. например, на каждой странице необходимо заменить <meta http-equiv="Content-Type" content="text/html; charset=windows-1251">  на <meta http-equiv="Content-Type" content="text/html; charset=utf-8">.

1. В программе APE Utilities for the web designer указываю какой текст заменить на какой. Обрабатываю.
2. Так как на uCoz необходимо выгружать файлы в формате UTF-8, я создаю дополнительную папку на компьютере и туда оправляю обработанные программой DeniSoft text Converter файлы.
3. Выгружаю на сайт файлы в формате UTF-8 с помощью бесплатной программы FileZilla https://filezilla-project.org/download.php?type=client

И всё. Сайт обновлён страницами без крякозябиков.

Более подробно могу рассказать по мылу. Пишите rvsn2@yandex.ru
28.04.2013 в 23:23      0  

Скажите, что делать, кодирую в UTF8, и все-таки везде на странице знаки вопроса? Как исправить положение? Спасибо
29.04.2013 в 09:11      0  

Здравствуйте, Вам также необходимо выполнить данные действия: http://forum.ucoz.ru/forum/56-50259-1009001-16-1365500957

После конвертации *html файлы были соответственно перезагружены на Ваш сайт?
Если данный сайт принадлежит Вам: http://elmanosmanov.narod.ru – как Вы можете обнаружить, проблема существует лишь с главной страницей Вашего сайта, другие страницы корректно отображаются.
19.04.2013 в 12:37      0  

Все сделал как положено, конвертацию файлов с помощью UTFCast Express, все равно пишет абракадабру непонятную, в чем проблема
19.04.2013 в 15:32      0  

Здравствуйте, вероятно, Вам также необходимо выполнить данные действия: http://forum.ucoz.ru/forum/56-50259-1009001-16-1365500957
16.04.2013 в 08:31      0  

Текст конвертировался как положено , а вот фотографии не показывает на страничках, что делать?
16.04.2013 в 09:12      0  

Здравствуйте, Вам необходимо проверить верность конечного пути на изображения. Например, на Вашем сайте имеется изображение, что указано как:
Цитата
http://kazaki33.narod.ru/photo/19595.p.jpg

При обращении по данной ссылке изображение не обнаруживается, по данной причине и не отображается. Вам необходимо либо загрузить изображения в соответствующую папку на Вашем сайте, либо указать верный путь на изображения.
16.05.2013 в 12:37      0  

Проблема с картинками есть еще и другая. В оригинале:
http://proletarskoe.narod.ru/images/foto/2012_13/vesna/IMG_2638.JPG
после загрузки на сайт:
http://proletarskoe.narod.ru/images/foto/2012_13/vesna/IMG_2638.jpg
Все. Он тупит. переименовывать каждый раз расширения это тот еще гемор.
А многие цифровики его ставят большим по умолчанию. Сайт у меня школьный и каждый раз перекладывать из пустово в порожнее мало охоты. Можно ли эту проблему решить. На яндексе ее не существовало. Слишком грамотная система это тоже не весело.

Заранее спасибо за ответ.
15.04.2013 в 19:00      0  

Практически в соответствии с инструкцией: Шаблон  очень легко конвертировался через Dreamweaver, но содеожимое страниц не захотелось. Полностью проблему решило открытие в Notepad++  и преобразование в utf-8  с последующим сохранением.
И всё. Причем Dreamweaver можно было не применять. Он понадобился в последствии при восстановлении из копии одной из страниц.
С уважением, Юрий.
15.04.2013 в 22:31      0  

Т.е. предложенным выше способом совсем не получилось? Если остался старый несконвертированый бекап, может дадите его мне? Для чистоты эксперемента проверить в чем дело.
14.04.2013 в 21:33      +1  

Справился своими силами.
1 2 »