-
- Открыть редактор FAR. Нажать или не нажимать F8 таким образом, чтобы напротив восьмерки было написано "Win". Копируешь текст в окно редактора. Нажимаешь F8. mr-x(115 знак., 10.12.2015 13:07)
- Фар это ручками, но очень не хочется symbions(56 знак., 10.12.2015 14:34)
- meld, vimdiff и т.п. в помощь. - fk0(10.12.2015 23:49)
- За meld спасибо. symbions(214 знак., 11.12.2015 09:40 - 09:43)
- Слева декодированный из одной кодировки, справа из другой. Если слева текст неправильный -- копировать строку влево. - fk0(11.12.2015 11:21)
- Просто прелесть! symbions(90 знак., 11.12.2015 22:47)
- Слева декодированный из одной кодировки, справа из другой. Если слева текст неправильный -- копировать строку влево. - fk0(11.12.2015 11:21)
- За meld спасибо. symbions(214 знак., 11.12.2015 09:40 - 09:43)
- meld, vimdiff и т.п. в помощь. - fk0(10.12.2015 23:49)
- Фар это ручками, но очень не хочется symbions(56 знак., 10.12.2015 14:34)
- Не слушай буденновцев, лови (все сделано и причесано несколькими кликами в AkelPad) MBedder(666 знак., 10.12.2015 11:47 - 11:50)
- Транслит остался :-) - il-2(10.12.2015 15:38)
- Это не транслит, а высеры неприбитого вовремя горе-программера. "Я таких еще в детстве из рогатки бы убивал!"(с) - MBedder(10.12.2015 16:30)
- Спасибо, счас попробую symbions(131 знак., 10.12.2015 14:34 - 14:53)
- Ничего муторного - выделить строки с кракозябрами, потом Правка - Выделение - Перекодировать (автовыбор). - MBedder(10.12.2015 15:12)
- Ну как сказать symbions(294 знак., 10.12.2015 15:24 - 11.12.2015 09:56)
- Глаза бояться, а руки - делают. Пятьдесят файлов это неделя с перекурами. Одному человеку. - Скрипач(11.12.2015 09:51)
- За три часа написать скрипт, который всё сделает. С автомагическим угадыванием кодировки для каждой строчки и проверкой по словарю. Кстати вместо словаря можно ещё ispell использовать (любой спеллчекер работающий из командной строки): чем больше fk0(101 знак., 11.12.2015 11:23)
- Я бы не взялся. (пожимает плечами) - Скрипач(11.12.2015 11:26)
- Поиск готового решения затянулся на сутки, скриптовое оценили в три часа и не взялись, мой сишный велосипед в бронхитном состоянии был набросан за два часа, включая высасывание из пальца алгоритма и регулярные медицинские припарки. Тестовую Николай Коровин(160 знак., 11.12.2015 17:02)
- На сутки календарного времени - моего в этой конфе - полчаса. Общие потери людей что советовали - часа 3, причём из них ваши 2. Чтобы написать скрипт - надо знать. Я, на жаль, не знаю. (не. что-то и кое-что - но за 3 часа не сделаю) symbions(863 знак., 11.12.2015 22:45)
- Вам еще вспомнить что не все файлы - текстовые, как минимум. Скрипач(275 знак., 11.12.2015 17:11)
- Я бы сначала дождался результатов боевого испытания, если оно будет. Нажать серый плюс и выделить .CPP .H, но не .elf и не .bin — не проблема. Теоретиш-кукаретиш можно сколько угодно, а по факту эксперимент — палач любой теории. - Николай Коровин(11.12.2015 17:24)
- В любом случае, два дня уже тю-тю. Так что еще будем посмотреть, за кем тот палач пришел 8) - Скрипач(11.12.2015 17:26)
- Я бы сначала дождался результатов боевого испытания, если оно будет. Нажать серый плюс и выделить .CPP .H, но не .elf и не .bin — не проблема. Теоретиш-кукаретиш можно сколько угодно, а по факту эксперимент — палач любой теории. - Николай Коровин(11.12.2015 17:24)
- Поиск готового решения затянулся на сутки, скриптовое оценили в три часа и не взялись, мой сишный велосипед в бронхитном состоянии был набросан за два часа, включая высасывание из пальца алгоритма и регулярные медицинские припарки. Тестовую Николай Коровин(160 знак., 11.12.2015 17:02)
- Я бы не взялся. (пожимает плечами) - Скрипач(11.12.2015 11:26)
- За три часа написать скрипт, который всё сделает. С автомагическим угадыванием кодировки для каждой строчки и проверкой по словарю. Кстати вместо словаря можно ещё ispell использовать (любой спеллчекер работающий из командной строки): чем больше fk0(101 знак., 11.12.2015 11:23)
- А как ты без человека выделишь ТОЛЬКО строки с кривой кодировкой, если в файле есть и прямая? А в остальном - AkelPad скриптуется/автоматизируется на раз - кури форум и доки --> - MBedder(10.12.2015 16:27, ссылка)
- Можно выделить только комментарии, автоматически. Дальше agrep'ом смотреть по словарю и считать метрику, насколько похоже на человеческий язык (сумма расстояний Левенштейна для всех слов комментария где меньше) -- выбирать оптимальный вариант и fk0(18 знак., 10.12.2015 23:51)
- В этом то и загвоздка. И проблема в этом же программы. что fk0 предлагал - я то её запустил, чтоб конвертила, но она конвертит все строки, поэтому половина строк становится в Вин кодировке, например, а другая - вообще в ахинею превращается symbions(167 знак., 10.12.2015 18:04)
- Сначала определиться, что во что перепутано. Это кодировка Win, которая была интерпретирована как DOS, это видно по тому, какие именно кракозябры. Значит, её и надо сохранить в кодировке DOS, в каком бы юникоде она сейчас ни была, и для Николай Коровин(206 знак., 10.12.2015 17:03)
- Там ничо не перепутано, это файл с проекта, которому уже 17 лет. Сначала писался в Фотоне (редактор досовский такой) и старой аврстудии. Потом уже в новой, виндовой студии. symbions(66 знак., 10.12.2015 18:06)
- Да ладно, в кодировке Винды… а если перепроверить? Или хексовые константы, которые писались очень давно, откомментированы в кодировке винды, а свежие высеры школокодера — в досовской? Именно что в ДОСовской он был открыт в первом сообщении. - Николай Коровин(10.12.2015 19:29 - 19:44)
- Именно поэтому я всех своих программистов, писавших русские каменты, давно расстрелял и закопал :)) - MBedder(10.12.2015 18:20)
- Кто же начальство даст растрелять-то? symbions(105 знак., 10.12.2015 23:03)
- "Будь проще - и за тобой потянутся люди"(с) :)) - MBedder(10.12.2015 17:27, картинка)
- Куда уж проще-то? %) UPD: собрал всё вместе. Николай Коровин(3235 знак., 10.12.2015 17:40 - 19:43)
- Да, кстати, древние кодировщики Левенштейнами не извращались и тупо угадывали кодировку по частоте символов (а пропускать текст через кодировщик можно построчно... чтоб угадывал для каждой строки заново). Разумеется не сама частота символов важна, fk0(24 знак., 11.12.2015 00:09, ссылка)
- Капитан Очевидность :) - Николай Коровин(11.12.2015 17:08)
- ~/temp $ gcc a.c symbions(204 знак., 10.12.2015 23:01)
- А я опять своей допотопной «ваткой», сиречь OpenWatcom %) - Николай Коровин(10.12.2015 23:35)
- ясно - symbions(10.12.2015 23:47)
- угу :( - Николай Коровин(10.12.2015 23:47)
- а exe выложить можешь? Тогда на одном тектсе проверю, отвечу работает ли и где ошибётся - symbions(11.12.2015 10:07)
- UnDOS SourceFile.CPP TargetFile.CPP. Проверьте, пожалуйста, это будет очень важно всем нам в плане организации своей жизни. Особенно мне. Заранее спасибо. И чем больше статистика, тем более спасибо. Николай Коровин(11.12.2015 14:10 - 14:13)
- Не раньше вторника symbions(102 знак., 11.12.2015 22:16)
- Да хоть когда угодно :) Важен сам факт — или велоэкспромт является решением, или не является. Ну, плюс промежуточные. - Николай Коровин(11.12.2015 22:29)
- Проверил на файле 32,8 кБ symbions(713 знак., 16.12.2015 00:42)
- Это был неразрывный пробел, он скорее ожидал в сырце найти «а» из другой кодировки, чем такие высокие материи :) С прогой всё интереснее: она откопала два куска досовского каммента! «1-ую канала» в мастдайной кодировке выглядело как Николай Коровин(441 знак., 16.12.2015 01:42)
- Еще - в исходном фрагменте в ДОСовских каментах вместо русских "я" стоят пробелы - MBedder(16.12.2015 01:57)
- Ага, это обратная такая пара, код 0xFF. Буковка «я» в винде и NBSP в DOS. А вот 0xA0 — наоборот, в винде NBSP и в досе буковка «а» :) Такие вот взаимно прячущиеся буковки %) - Николай Коровин(16.12.2015 02:32)
- Да, но в ИСХОДНИКЕ уже нету русских "я" (вместо них - пробелы, 0х20), и никакой конвертер не поможет - только интеллеХт юзера и ручками, ручками. Дать бы говнокодеру перелопатить все эти 100500 файлов - глядишь, и перестанет русские каменты лепить - MBedder(16.12.2015 11:31 - 11:35)
- В котором именно из сонмища исходников? В принципе, в том, который копипасту через Сахару прошёл — ессно все нобрейки потеряются, превратившись в обычные. В том, что пересохранялся локально — особо херовые редакторы тоже порежут. - Николай Коровин(16.12.2015 15:58)
- Я про фрагмент закракозябренного исходника из корневого поста - MBedder(16.12.2015 16:05)
- «1 признак что прибор включен в FM-ке не сохран ем»? Да, после прохождения через веб-форум без шансов. Все нобры становятся простыми пробелами. А скрипт/прога в оригинальном си что-то понаходили вроде… - Николай Коровин(16.12.2015 16:27)
- Надо попросить ТС прицепить файл исходника, чтобы проверить, форум или нет - MBedder(16.12.2015 16:53)
- форум, форум. symbions(176 знак., 16.12.2015 20:32)
- Ну да, все 'я' на месте MBedder(1125 знак., 16.12.2015 23:58)
- форум, форум. symbions(176 знак., 16.12.2015 20:32)
- Надо попросить ТС прицепить файл исходника, чтобы проверить, форум или нет - MBedder(16.12.2015 16:53)
- «1 признак что прибор включен в FM-ке не сохран ем»? Да, после прохождения через веб-форум без шансов. Все нобры становятся простыми пробелами. А скрипт/прога в оригинальном си что-то понаходили вроде… - Николай Коровин(16.12.2015 16:27)
- Я про фрагмент закракозябренного исходника из корневого поста - MBedder(16.12.2015 16:05)
- В котором именно из сонмища исходников? В принципе, в том, который копипасту через Сахару прошёл — ессно все нобрейки потеряются, превратившись в обычные. В том, что пересохранялся локально — особо херовые редакторы тоже порежут. - Николай Коровин(16.12.2015 15:58)
- Да, но в ИСХОДНИКЕ уже нету русских "я" (вместо них - пробелы, 0х20), и никакой конвертер не поможет - только интеллеХт юзера и ручками, ручками. Дать бы говнокодеру перелопатить все эти 100500 файлов - глядишь, и перестанет русские каменты лепить - MBedder(16.12.2015 11:31 - 11:35)
- Ага, это обратная такая пара, код 0xFF. Буковка «я» в винде и NBSP в DOS. А вот 0xA0 — наоборот, в винде NBSP и в досе буковка «а» :) Такие вот взаимно прячущиеся буковки %) - Николай Коровин(16.12.2015 02:32)
- Еще - в исходном фрагменте в ДОСовских каментах вместо русских "я" стоят пробелы - MBedder(16.12.2015 01:57)
- Это был неразрывный пробел, он скорее ожидал в сырце найти «а» из другой кодировки, чем такие высокие материи :) С прогой всё интереснее: она откопала два куска досовского каммента! «1-ую канала» в мастдайной кодировке выглядело как Николай Коровин(441 знак., 16.12.2015 01:42)
- Проверил на файле 32,8 кБ symbions(713 знак., 16.12.2015 00:42)
- Да хоть когда угодно :) Важен сам факт — или велоэкспромт является решением, или не является. Ну, плюс промежуточные. - Николай Коровин(11.12.2015 22:29)
- Не раньше вторника symbions(102 знак., 11.12.2015 22:16)
- UnDOS SourceFile.CPP TargetFile.CPP. Проверьте, пожалуйста, это будет очень важно всем нам в плане организации своей жизни. Особенно мне. Заранее спасибо. И чем больше статистика, тем более спасибо. Николай Коровин(11.12.2015 14:10 - 14:13)
- а exe выложить можешь? Тогда на одном тектсе проверю, отвечу работает ли и где ошибётся - symbions(11.12.2015 10:07)
- угу :( - Николай Коровин(10.12.2015 23:47)
- ясно - symbions(10.12.2015 23:47)
- А я опять своей допотопной «ваткой», сиречь OpenWatcom %) - Николай Коровин(10.12.2015 23:35)
- А теперь закодь VeryProbablyPossible в IndeedItIs :)) - MBedder(10.12.2015 18:01 - 18:04)
- Да, кстати, древние кодировщики Левенштейнами не извращались и тупо угадывали кодировку по частоте символов (а пропускать текст через кодировщик можно построчно... чтоб угадывал для каждой строки заново). Разумеется не сама частота символов важна, fk0(24 знак., 11.12.2015 00:09, ссылка)
- Куда уж проще-то? %) UPD: собрал всё вместе. Николай Коровин(3235 знак., 10.12.2015 17:40 - 19:43)
- Там ничо не перепутано, это файл с проекта, которому уже 17 лет. Сначала писался в Фотоне (редактор досовский такой) и старой аврстудии. Потом уже в новой, виндовой студии. symbions(66 знак., 10.12.2015 18:06)
- Глаза бояться, а руки - делают. Пятьдесят файлов это неделя с перекурами. Одному человеку. - Скрипач(11.12.2015 09:51)
- Хе... А кофе оно не умеет готовить? - SciFi(10.12.2015 15:23)
- Кесарю - кесарево :)) - MBedder(10.12.2015 16:31)
- Сечение? - Крок(10.12.2015 18:07)
- Кесарю - кесарево :)) - MBedder(10.12.2015 16:31)
- Ну как сказать symbions(294 знак., 10.12.2015 15:24 - 11.12.2015 09:56)
- Ничего муторного - выделить строки с кракозябрами, потом Правка - Выделение - Перекодировать (автовыбор). - MBedder(10.12.2015 15:12)
- Транслит остался :-) - il-2(10.12.2015 15:38)
- Можно посоветовать: 1) с помощью утилиты перекодирования (например - Штирлиц) получить копию с "исправленными" нечитаемыми комментариями 2) с помощью утилиты сравнения и слияния файлов (например - Beyond Compare) в "ручном" режиме из двух файлов Палыч(54 знак., 10.12.2015 11:44)
- Лучше уж в фаре - symbions(10.12.2015 14:33)
- Напомнило... - fk0(10.12.2015 11:31, youtube)
- Всё очевидно: fk0(121 знак., 10.12.2015 11:28, картинка)
- спасибо, помогло - комментариев на русском вообще не осталось ;) symbions(37 знак., 10.12.2015 14:33)
- Не в команде, а в ДНК :)) - MBedder(10.12.2015 15:05)
- В ДНК у тебя. А у symbions, очевидно, и кодировка файла не utf-8, и/или кодировка терминала не KOI8-R. Параметры нужно было заменить на разумные для конкретного случая. - fk0(11.12.2015 00:17)
- Поигрался я с разными кодировками - автоматом не выходит - ибо оно конвертит все сторки. Например, даю команду symbions(128 знак., 11.12.2015 10:02)
- А iconv и не угадывает. Он работает строго как скажешь. Автоматом, вот тебе: fk0(1373 знак., 11.12.2015 11:44)
- Спасибо, заработало - вот она золотая пуля :) symbions(531 знак., 11.12.2015 22:06 - 12.12.2015 00:27)
- А iconv и не угадывает. Он работает строго как скажешь. Автоматом, вот тебе: fk0(1373 знак., 11.12.2015 11:44)
- Поигрался я с разными кодировками - автоматом не выходит - ибо оно конвертит все сторки. Например, даю команду symbions(128 знак., 11.12.2015 10:02)
- В ДНК у тебя. А у symbions, очевидно, и кодировка файла не utf-8, и/или кодировка терминала не KOI8-R. Параметры нужно было заменить на разумные для конкретного случая. - fk0(11.12.2015 00:17)
- Не в команде, а в ДНК :)) - MBedder(10.12.2015 15:05)
- спасибо, помогло - комментариев на русском вообще не осталось ;) symbions(37 знак., 10.12.2015 14:33)
- Открыть редактор FAR. Нажать или не нажимать F8 таким образом, чтобы напротив восьмерки было написано "Win". Копируешь текст в окно редактора. Нажимаешь F8. mr-x(115 знак., 10.12.2015 13:07)