-
- Ну как сказать symbions(294 знак., 10.12.2015 15:24 - 11.12.2015 09:56)
- Глаза бояться, а руки - делают. Пятьдесят файлов это неделя с перекурами. Одному человеку. - Скрипач(11.12.2015 09:51)
- За три часа написать скрипт, который всё сделает. С автомагическим угадыванием кодировки для каждой строчки и проверкой по словарю. Кстати вместо словаря можно ещё ispell использовать (любой спеллчекер работающий из командной строки): чем больше fk0(101 знак., 11.12.2015 11:23)
- Я бы не взялся. (пожимает плечами) - Скрипач(11.12.2015 11:26)
- Поиск готового решения затянулся на сутки, скриптовое оценили в три часа и не взялись, мой сишный велосипед в бронхитном состоянии был набросан за два часа, включая высасывание из пальца алгоритма и регулярные медицинские припарки. Тестовую Николай Коровин(160 знак., 11.12.2015 17:02)
- На сутки календарного времени - моего в этой конфе - полчаса. Общие потери людей что советовали - часа 3, причём из них ваши 2. Чтобы написать скрипт - надо знать. Я, на жаль, не знаю. (не. что-то и кое-что - но за 3 часа не сделаю) symbions(863 знак., 11.12.2015 22:45)
- Вам еще вспомнить что не все файлы - текстовые, как минимум. Скрипач(275 знак., 11.12.2015 17:11)
- Я бы сначала дождался результатов боевого испытания, если оно будет. Нажать серый плюс и выделить .CPP .H, но не .elf и не .bin — не проблема. Теоретиш-кукаретиш можно сколько угодно, а по факту эксперимент — палач любой теории. - Николай Коровин(11.12.2015 17:24)
- В любом случае, два дня уже тю-тю. Так что еще будем посмотреть, за кем тот палач пришел 8) - Скрипач(11.12.2015 17:26)
- Я бы сначала дождался результатов боевого испытания, если оно будет. Нажать серый плюс и выделить .CPP .H, но не .elf и не .bin — не проблема. Теоретиш-кукаретиш можно сколько угодно, а по факту эксперимент — палач любой теории. - Николай Коровин(11.12.2015 17:24)
- Поиск готового решения затянулся на сутки, скриптовое оценили в три часа и не взялись, мой сишный велосипед в бронхитном состоянии был набросан за два часа, включая высасывание из пальца алгоритма и регулярные медицинские припарки. Тестовую Николай Коровин(160 знак., 11.12.2015 17:02)
- Я бы не взялся. (пожимает плечами) - Скрипач(11.12.2015 11:26)
- За три часа написать скрипт, который всё сделает. С автомагическим угадыванием кодировки для каждой строчки и проверкой по словарю. Кстати вместо словаря можно ещё ispell использовать (любой спеллчекер работающий из командной строки): чем больше fk0(101 знак., 11.12.2015 11:23)
- А как ты без человека выделишь ТОЛЬКО строки с кривой кодировкой, если в файле есть и прямая? А в остальном - AkelPad скриптуется/автоматизируется на раз - кури форум и доки --> - MBedder(10.12.2015 16:27, ссылка)
- Можно выделить только комментарии, автоматически. Дальше agrep'ом смотреть по словарю и считать метрику, насколько похоже на человеческий язык (сумма расстояний Левенштейна для всех слов комментария где меньше) -- выбирать оптимальный вариант и fk0(18 знак., 10.12.2015 23:51)
- В этом то и загвоздка. И проблема в этом же программы. что fk0 предлагал - я то её запустил, чтоб конвертила, но она конвертит все строки, поэтому половина строк становится в Вин кодировке, например, а другая - вообще в ахинею превращается symbions(167 знак., 10.12.2015 18:04)
- Сначала определиться, что во что перепутано. Это кодировка Win, которая была интерпретирована как DOS, это видно по тому, какие именно кракозябры. Значит, её и надо сохранить в кодировке DOS, в каком бы юникоде она сейчас ни была, и для Николай Коровин(206 знак., 10.12.2015 17:03)
- Там ничо не перепутано, это файл с проекта, которому уже 17 лет. Сначала писался в Фотоне (редактор досовский такой) и старой аврстудии. Потом уже в новой, виндовой студии. symbions(66 знак., 10.12.2015 18:06)
- Да ладно, в кодировке Винды… а если перепроверить? Или хексовые константы, которые писались очень давно, откомментированы в кодировке винды, а свежие высеры школокодера — в досовской? Именно что в ДОСовской он был открыт в первом сообщении. - Николай Коровин(10.12.2015 19:29 - 19:44)
- Именно поэтому я всех своих программистов, писавших русские каменты, давно расстрелял и закопал :)) - MBedder(10.12.2015 18:20)
- Кто же начальство даст растрелять-то? symbions(105 знак., 10.12.2015 23:03)
- "Будь проще - и за тобой потянутся люди"(с) :)) - MBedder(10.12.2015 17:27, картинка)
- Куда уж проще-то? %) UPD: собрал всё вместе. Николай Коровин(3235 знак., 10.12.2015 17:40 - 19:43)
- Да, кстати, древние кодировщики Левенштейнами не извращались и тупо угадывали кодировку по частоте символов (а пропускать текст через кодировщик можно построчно... чтоб угадывал для каждой строки заново). Разумеется не сама частота символов важна, fk0(24 знак., 11.12.2015 00:09, ссылка)
- Капитан Очевидность :) - Николай Коровин(11.12.2015 17:08)
- ~/temp $ gcc a.c symbions(204 знак., 10.12.2015 23:01)
- А я опять своей допотопной «ваткой», сиречь OpenWatcom %) - Николай Коровин(10.12.2015 23:35)
- ясно - symbions(10.12.2015 23:47)
- угу :( - Николай Коровин(10.12.2015 23:47)
- а exe выложить можешь? Тогда на одном тектсе проверю, отвечу работает ли и где ошибётся - symbions(11.12.2015 10:07)
- UnDOS SourceFile.CPP TargetFile.CPP. Проверьте, пожалуйста, это будет очень важно всем нам в плане организации своей жизни. Особенно мне. Заранее спасибо. И чем больше статистика, тем более спасибо. Николай Коровин(11.12.2015 14:10 - 14:13)
- Не раньше вторника symbions(102 знак., 11.12.2015 22:16)
- Да хоть когда угодно :) Важен сам факт — или велоэкспромт является решением, или не является. Ну, плюс промежуточные. - Николай Коровин(11.12.2015 22:29)
- Проверил на файле 32,8 кБ symbions(713 знак., 16.12.2015 00:42)
- Это был неразрывный пробел, он скорее ожидал в сырце найти «а» из другой кодировки, чем такие высокие материи :) С прогой всё интереснее: она откопала два куска досовского каммента! «1-ую канала» в мастдайной кодировке выглядело как Николай Коровин(441 знак., 16.12.2015 01:42)
- Еще - в исходном фрагменте в ДОСовских каментах вместо русских "я" стоят пробелы - MBedder(16.12.2015 01:57)
- Ага, это обратная такая пара, код 0xFF. Буковка «я» в винде и NBSP в DOS. А вот 0xA0 — наоборот, в винде NBSP и в досе буковка «а» :) Такие вот взаимно прячущиеся буковки %) - Николай Коровин(16.12.2015 02:32)
- Да, но в ИСХОДНИКЕ уже нету русских "я" (вместо них - пробелы, 0х20), и никакой конвертер не поможет - только интеллеХт юзера и ручками, ручками. Дать бы говнокодеру перелопатить все эти 100500 файлов - глядишь, и перестанет русские каменты лепить - MBedder(16.12.2015 11:31 - 11:35)
- В котором именно из сонмища исходников? В принципе, в том, который копипасту через Сахару прошёл — ессно все нобрейки потеряются, превратившись в обычные. В том, что пересохранялся локально — особо херовые редакторы тоже порежут. - Николай Коровин(16.12.2015 15:58)
- Я про фрагмент закракозябренного исходника из корневого поста - MBedder(16.12.2015 16:05)
- «1 признак что прибор включен в FM-ке не сохран ем»? Да, после прохождения через веб-форум без шансов. Все нобры становятся простыми пробелами. А скрипт/прога в оригинальном си что-то понаходили вроде… - Николай Коровин(16.12.2015 16:27)
- Надо попросить ТС прицепить файл исходника, чтобы проверить, форум или нет - MBedder(16.12.2015 16:53)
- форум, форум. symbions(176 знак., 16.12.2015 20:32)
- Ну да, все 'я' на месте MBedder(1125 знак., 16.12.2015 23:58)
- форум, форум. symbions(176 знак., 16.12.2015 20:32)
- Надо попросить ТС прицепить файл исходника, чтобы проверить, форум или нет - MBedder(16.12.2015 16:53)
- «1 признак что прибор включен в FM-ке не сохран ем»? Да, после прохождения через веб-форум без шансов. Все нобры становятся простыми пробелами. А скрипт/прога в оригинальном си что-то понаходили вроде… - Николай Коровин(16.12.2015 16:27)
- Я про фрагмент закракозябренного исходника из корневого поста - MBedder(16.12.2015 16:05)
- В котором именно из сонмища исходников? В принципе, в том, который копипасту через Сахару прошёл — ессно все нобрейки потеряются, превратившись в обычные. В том, что пересохранялся локально — особо херовые редакторы тоже порежут. - Николай Коровин(16.12.2015 15:58)
- Да, но в ИСХОДНИКЕ уже нету русских "я" (вместо них - пробелы, 0х20), и никакой конвертер не поможет - только интеллеХт юзера и ручками, ручками. Дать бы говнокодеру перелопатить все эти 100500 файлов - глядишь, и перестанет русские каменты лепить - MBedder(16.12.2015 11:31 - 11:35)
- Ага, это обратная такая пара, код 0xFF. Буковка «я» в винде и NBSP в DOS. А вот 0xA0 — наоборот, в винде NBSP и в досе буковка «а» :) Такие вот взаимно прячущиеся буковки %) - Николай Коровин(16.12.2015 02:32)
- Еще - в исходном фрагменте в ДОСовских каментах вместо русских "я" стоят пробелы - MBedder(16.12.2015 01:57)
- Это был неразрывный пробел, он скорее ожидал в сырце найти «а» из другой кодировки, чем такие высокие материи :) С прогой всё интереснее: она откопала два куска досовского каммента! «1-ую канала» в мастдайной кодировке выглядело как Николай Коровин(441 знак., 16.12.2015 01:42)
- Проверил на файле 32,8 кБ symbions(713 знак., 16.12.2015 00:42)
- Да хоть когда угодно :) Важен сам факт — или велоэкспромт является решением, или не является. Ну, плюс промежуточные. - Николай Коровин(11.12.2015 22:29)
- Не раньше вторника symbions(102 знак., 11.12.2015 22:16)
- UnDOS SourceFile.CPP TargetFile.CPP. Проверьте, пожалуйста, это будет очень важно всем нам в плане организации своей жизни. Особенно мне. Заранее спасибо. И чем больше статистика, тем более спасибо. Николай Коровин(11.12.2015 14:10 - 14:13)
- а exe выложить можешь? Тогда на одном тектсе проверю, отвечу работает ли и где ошибётся - symbions(11.12.2015 10:07)
- угу :( - Николай Коровин(10.12.2015 23:47)
- ясно - symbions(10.12.2015 23:47)
- А я опять своей допотопной «ваткой», сиречь OpenWatcom %) - Николай Коровин(10.12.2015 23:35)
- А теперь закодь VeryProbablyPossible в IndeedItIs :)) - MBedder(10.12.2015 18:01 - 18:04)
- Да, кстати, древние кодировщики Левенштейнами не извращались и тупо угадывали кодировку по частоте символов (а пропускать текст через кодировщик можно построчно... чтоб угадывал для каждой строки заново). Разумеется не сама частота символов важна, fk0(24 знак., 11.12.2015 00:09, ссылка)
- Куда уж проще-то? %) UPD: собрал всё вместе. Николай Коровин(3235 знак., 10.12.2015 17:40 - 19:43)
- Там ничо не перепутано, это файл с проекта, которому уже 17 лет. Сначала писался в Фотоне (редактор досовский такой) и старой аврстудии. Потом уже в новой, виндовой студии. symbions(66 знак., 10.12.2015 18:06)
- Глаза бояться, а руки - делают. Пятьдесят файлов это неделя с перекурами. Одному человеку. - Скрипач(11.12.2015 09:51)
- Хе... А кофе оно не умеет готовить? - SciFi(10.12.2015 15:23)
- Кесарю - кесарево :)) - MBedder(10.12.2015 16:31)
- Сечение? - Крок(10.12.2015 18:07)
- Кесарю - кесарево :)) - MBedder(10.12.2015 16:31)
- Ну как сказать symbions(294 знак., 10.12.2015 15:24 - 11.12.2015 09:56)