- 
	- Ну как сказать  symbions(294 знак., 10.12.2015 15:24 - 11.12.2015 09:56)
			- Глаза бояться, а руки - делают. Пятьдесят файлов это неделя с перекурами. Одному человеку. - Скрипач(11.12.2015 09:51)
					- За три часа написать скрипт, который всё сделает. С автомагическим угадыванием кодировки для каждой строчки и проверкой по словарю. Кстати вместо словаря можно ещё ispell использовать (любой спеллчекер работающий из командной строки): чем больше  fk0(101 знак., 11.12.2015 11:23)
							- Я бы не взялся. (пожимает плечами) - Скрипач(11.12.2015 11:26)
									- Поиск готового решения затянулся на сутки, скриптовое оценили в три часа и не взялись, мой сишный велосипед в бронхитном состоянии был набросан за два часа, включая высасывание из пальца алгоритма и регулярные медицинские припарки. Тестовую  Николай Коровин(160 знак., 11.12.2015 17:02)
											- На сутки календарного времени - моего в этой конфе - полчаса. Общие потери людей что советовали - часа 3, причём из них ваши 2. Чтобы написать скрипт - надо знать. Я, на жаль, не знаю. (не. что-то и кое-что - но за 3 часа не сделаю) symbions(863 знак., 11.12.2015 22:45)
- Вам еще вспомнить что не все файлы - текстовые, как минимум.   Скрипач(275 знак., 11.12.2015 17:11)
													- Я бы сначала дождался результатов боевого испытания, если оно будет. Нажать серый плюс и выделить .CPP .H, но не .elf и не .bin — не проблема. Теоретиш-кукаретиш можно сколько угодно, а по факту эксперимент — палач любой теории. - Николай Коровин(11.12.2015 17:24)
															- В любом случае, два дня уже тю-тю. Так что еще будем посмотреть, за кем тот палач пришел 8) - Скрипач(11.12.2015 17:26)
 
 
- Я бы сначала дождался результатов боевого испытания, если оно будет. Нажать серый плюс и выделить .CPP .H, но не .elf и не .bin — не проблема. Теоретиш-кукаретиш можно сколько угодно, а по факту эксперимент — палач любой теории. - Николай Коровин(11.12.2015 17:24)
															
 
 
- Поиск готового решения затянулся на сутки, скриптовое оценили в три часа и не взялись, мой сишный велосипед в бронхитном состоянии был набросан за два часа, включая высасывание из пальца алгоритма и регулярные медицинские припарки. Тестовую  Николай Коровин(160 знак., 11.12.2015 17:02)
											
 
- Я бы не взялся. (пожимает плечами) - Скрипач(11.12.2015 11:26)
									
 
- За три часа написать скрипт, который всё сделает. С автомагическим угадыванием кодировки для каждой строчки и проверкой по словарю. Кстати вместо словаря можно ещё ispell использовать (любой спеллчекер работающий из командной строки): чем больше  fk0(101 знак., 11.12.2015 11:23)
							
- А как ты без человека выделишь ТОЛЬКО строки с кривой кодировкой, если в файле есть и прямая? А в остальном - AkelPad скриптуется/автоматизируется на раз - кури форум и доки --> - MBedder(10.12.2015 16:27, ссылка)
					- Можно выделить только комментарии, автоматически. Дальше agrep'ом смотреть по словарю и считать метрику, насколько похоже на человеческий язык (сумма расстояний Левенштейна для всех слов комментария где меньше) -- выбирать оптимальный вариант и fk0(18 знак., 10.12.2015 23:51)
- В этом то и загвоздка. И проблема в этом же программы. что fk0 предлагал - я то её запустил, чтоб конвертила, но она конвертит все строки, поэтому половина строк становится в Вин кодировке, например, а другая - вообще в ахинею превращается symbions(167 знак., 10.12.2015 18:04)
- Сначала определиться, что во что перепутано. Это кодировка Win, которая была интерпретирована как DOS, это видно по тому, какие именно кракозябры. Значит, её и надо сохранить в кодировке DOS, в каком бы юникоде она сейчас ни была, и для  Николай Коровин(206 знак., 10.12.2015 17:03)
							- Там ничо не перепутано, это файл с проекта, которому уже 17 лет. Сначала писался в Фотоне (редактор досовский такой) и старой аврстудии. Потом уже в новой, виндовой студии.   symbions(66 знак., 10.12.2015 18:06)
									- Да ладно, в кодировке Винды… а если перепроверить? Или хексовые константы, которые писались очень давно, откомментированы в кодировке винды, а свежие высеры школокодера — в досовской? Именно что в ДОСовской он был открыт в первом сообщении. - Николай Коровин(10.12.2015 19:29 - 19:44)
- Именно поэтому я всех своих программистов, писавших русские каменты, давно расстрелял и закопал :)) - MBedder(10.12.2015 18:20)
											- Кто же начальство даст растрелять-то? symbions(105 знак., 10.12.2015 23:03)
 
 
- "Будь проще - и за тобой потянутся люди"(с) :)) - MBedder(10.12.2015 17:27, картинка)
									- Куда уж проще-то? %) UPD: собрал всё вместе.  Николай Коровин(3235 знак., 10.12.2015 17:40 - 19:43)
											- Да, кстати, древние кодировщики Левенштейнами не извращались и тупо угадывали кодировку по частоте символов (а пропускать текст через кодировщик можно построчно... чтоб угадывал для каждой строки заново). Разумеется не сама частота символов важна,  fk0(24 знак., 11.12.2015 00:09, ссылка)
													- Капитан Очевидность :) - Николай Коровин(11.12.2015 17:08)
 
- ~/temp $ gcc a.c  symbions(204 знак., 10.12.2015 23:01)
													- А я опять своей допотопной «ваткой», сиречь OpenWatcom %) - Николай Коровин(10.12.2015 23:35)
															- ясно - symbions(10.12.2015 23:47)
																	- угу :( - Николай Коровин(10.12.2015 23:47)
																			- а exe выложить можешь? Тогда на одном тектсе проверю, отвечу работает ли и где ошибётся - symbions(11.12.2015 10:07)
																					- UnDOS SourceFile.CPP TargetFile.CPP. Проверьте, пожалуйста, это будет очень важно всем нам в плане организации своей жизни. Особенно мне. Заранее спасибо. И чем больше статистика, тем более спасибо.  Николай Коровин(11.12.2015 14:10 - 14:13)
																							- Не раньше вторника  symbions(102 знак., 11.12.2015 22:16)
																									- Да хоть когда угодно :) Важен сам факт — или велоэкспромт является решением, или не является. Ну, плюс промежуточные. - Николай Коровин(11.12.2015 22:29)
																											- Проверил на файле 32,8 кБ  symbions(713 знак., 16.12.2015 00:42)
																													- Это был неразрывный пробел, он скорее ожидал в сырце найти «а» из другой кодировки, чем такие высокие материи :) С прогой всё интереснее: она откопала два куска досовского каммента! «1-ую канала» в мастдайной кодировке выглядело как  Николай Коровин(441 знак., 16.12.2015 01:42)
																															- Еще - в исходном фрагменте в ДОСовских каментах вместо русских "я" стоят пробелы - MBedder(16.12.2015 01:57)
																																	- Ага, это обратная такая пара, код 0xFF. Буковка «я» в винде и NBSP в DOS. А вот 0xA0 — наоборот, в винде NBSP и в досе буковка «а» :) Такие вот взаимно прячущиеся буковки %) - Николай Коровин(16.12.2015 02:32)
																																			- Да, но в ИСХОДНИКЕ уже нету русских "я" (вместо них - пробелы, 0х20), и никакой конвертер не поможет - только интеллеХт юзера и ручками, ручками. Дать бы говнокодеру перелопатить все эти 100500 файлов - глядишь, и перестанет русские каменты лепить - MBedder(16.12.2015 11:31 - 11:35)
																																					- В котором именно из сонмища исходников? В принципе, в том, который копипасту через Сахару прошёл — ессно все нобрейки потеряются, превратившись в обычные. В том, что пересохранялся локально — особо херовые редакторы тоже порежут. - Николай Коровин(16.12.2015 15:58)
																																							- Я про фрагмент закракозябренного исходника из корневого поста - MBedder(16.12.2015 16:05)
																																									- «1 признак что прибор включен в FM-ке не сохран ем»? Да, после прохождения через веб-форум без шансов. Все нобры становятся простыми пробелами. А скрипт/прога в оригинальном си что-то понаходили вроде… - Николай Коровин(16.12.2015 16:27)
																																											- Надо попросить ТС прицепить файл исходника, чтобы проверить, форум или нет - MBedder(16.12.2015 16:53)
																																													- форум, форум.  symbions(176 знак., 16.12.2015 20:32)
																																															- Ну да, все 'я' на месте MBedder(1125 знак., 16.12.2015 23:58)
 
 
- форум, форум.  symbions(176 знак., 16.12.2015 20:32)
																																															
 
- Надо попросить ТС прицепить файл исходника, чтобы проверить, форум или нет - MBedder(16.12.2015 16:53)
																																													
 
- «1 признак что прибор включен в FM-ке не сохран ем»? Да, после прохождения через веб-форум без шансов. Все нобры становятся простыми пробелами. А скрипт/прога в оригинальном си что-то понаходили вроде… - Николай Коровин(16.12.2015 16:27)
																																											
 
- Я про фрагмент закракозябренного исходника из корневого поста - MBedder(16.12.2015 16:05)
																																									
 
- В котором именно из сонмища исходников? В принципе, в том, который копипасту через Сахару прошёл — ессно все нобрейки потеряются, превратившись в обычные. В том, что пересохранялся локально — особо херовые редакторы тоже порежут. - Николай Коровин(16.12.2015 15:58)
																																							
 
- Да, но в ИСХОДНИКЕ уже нету русских "я" (вместо них - пробелы, 0х20), и никакой конвертер не поможет - только интеллеХт юзера и ручками, ручками. Дать бы говнокодеру перелопатить все эти 100500 файлов - глядишь, и перестанет русские каменты лепить - MBedder(16.12.2015 11:31 - 11:35)
																																					
 
- Ага, это обратная такая пара, код 0xFF. Буковка «я» в винде и NBSP в DOS. А вот 0xA0 — наоборот, в винде NBSP и в досе буковка «а» :) Такие вот взаимно прячущиеся буковки %) - Николай Коровин(16.12.2015 02:32)
																																			
 
- Еще - в исходном фрагменте в ДОСовских каментах вместо русских "я" стоят пробелы - MBedder(16.12.2015 01:57)
																																	
 
- Это был неразрывный пробел, он скорее ожидал в сырце найти «а» из другой кодировки, чем такие высокие материи :) С прогой всё интереснее: она откопала два куска досовского каммента! «1-ую канала» в мастдайной кодировке выглядело как  Николай Коровин(441 знак., 16.12.2015 01:42)
																															
 
- Проверил на файле 32,8 кБ  symbions(713 знак., 16.12.2015 00:42)
																													
 
- Да хоть когда угодно :) Важен сам факт — или велоэкспромт является решением, или не является. Ну, плюс промежуточные. - Николай Коровин(11.12.2015 22:29)
																											
 
- Не раньше вторника  symbions(102 знак., 11.12.2015 22:16)
																									
 
- UnDOS SourceFile.CPP TargetFile.CPP. Проверьте, пожалуйста, это будет очень важно всем нам в плане организации своей жизни. Особенно мне. Заранее спасибо. И чем больше статистика, тем более спасибо.  Николай Коровин(11.12.2015 14:10 - 14:13)
																							
 
- а exe выложить можешь? Тогда на одном тектсе проверю, отвечу работает ли и где ошибётся - symbions(11.12.2015 10:07)
																					
 
- угу :( - Николай Коровин(10.12.2015 23:47)
																			
 
- ясно - symbions(10.12.2015 23:47)
																	
 
- А я опять своей допотопной «ваткой», сиречь OpenWatcom %) - Николай Коровин(10.12.2015 23:35)
															
- А теперь закодь VeryProbablyPossible в IndeedItIs :)) - MBedder(10.12.2015 18:01 - 18:04)
 
- Да, кстати, древние кодировщики Левенштейнами не извращались и тупо угадывали кодировку по частоте символов (а пропускать текст через кодировщик можно построчно... чтоб угадывал для каждой строки заново). Разумеется не сама частота символов важна,  fk0(24 знак., 11.12.2015 00:09, ссылка)
													
 
- Куда уж проще-то? %) UPD: собрал всё вместе.  Николай Коровин(3235 знак., 10.12.2015 17:40 - 19:43)
											
 
- Там ничо не перепутано, это файл с проекта, которому уже 17 лет. Сначала писался в Фотоне (редактор досовский такой) и старой аврстудии. Потом уже в новой, виндовой студии.   symbions(66 знак., 10.12.2015 18:06)
									
 
 
- Глаза бояться, а руки - делают. Пятьдесят файлов это неделя с перекурами. Одному человеку. - Скрипач(11.12.2015 09:51)
					
- Хе... А кофе оно не умеет готовить? - SciFi(10.12.2015 15:23)
			- Кесарю - кесарево :)) - MBedder(10.12.2015 16:31)
					- Сечение? - Крок(10.12.2015 18:07)
 
 
- Кесарю - кесарево :)) - MBedder(10.12.2015 16:31)
					
 
- Ну как сказать  symbions(294 знак., 10.12.2015 15:24 - 11.12.2015 09:56)