From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: X-Spam-Checker-Version: SpamAssassin 3.2.5 (2008-06-10) on sa.int.altlinux.org X-Spam-Level: X-Spam-Status: No, score=-1.5 required=5.0 tests=BAYES_00, DNS_FROM_OPENWHOIS, SPF_PASS,UNPARSEABLE_RELAY autolearn=no version=3.2.5 Date: Wed, 24 Aug 2011 17:43:25 +0600 From: Sergey Korobitsin To: smoke-room@lists.altlinux.org Message-ID: <20110824114325.GP2067@undertaker.dev.lan.arta.kz> References: <20110822115325.GI2067@undertaker.dev.lan.arta.kz> MIME-Version: 1.0 Content-Type: text/plain; charset=utf-8 Content-Disposition: inline Content-Transfer-Encoding: 8bit In-Reply-To: User-Agent: Mutt/1.5.20 (2009-06-14) Subject: Re: [room] =?utf-8?b?0JrQsNC6INC90LDQudGC0Lgg0YTQsNC50Lsg0LIg0L7Qv9GA?= =?utf-8?b?0LXQtNC10LvRkdC90L3QvtC5INC60L7QtNC40YDQvtCy0LrQtT8=?= X-BeenThere: smoke-room@lists.altlinux.org X-Mailman-Version: 2.1.12 Precedence: list Reply-To: =?koi8-r?b?69XM2NTV0s7ZyiDPxtTP0MnL?= List-Id: =?koi8-r?b?69XM2NTV0s7ZyiDPxtTP0MnL?= List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Wed, 24 Aug 2011 11:43:35 -0000 Archived-At: List-Archive: Денис Черносов ☫ → To Культурный офтопик @ Wed, Aug 24, 2011 14:04 +0400 > Поэкспериментировал... > 1) вроде бы recode действительно не перекодирует лишнего, но > 2) преобразование виндовых разделителей в юниксовые он делать не умеет и > вообще не перекодирует такие файлы: > > recode: failed: Ambiguous output in step `CR-LF..data' > > Зато iconv их нормально отрабатывает. Но iconv точно пытается перекодироват > файлы, которые уже в юникоде и вылетает по ошибке: > > iconv: недопустимая входная последовательность в позиции 1099 > > Так что вижу выход рекурсивного прохода каталога с помощью recode и второго > прохода файлов, на которых он споткнулся с помощью iconv. Можно сделать в три этапа: 1. Прогоняем каталоги dos2unix (или аналогичной штукой, tr например) Результат: имеем все файлы в UNIX-кодировке 2. Натравливаем на готовые файлы. В идеале оно должно пройти без ошибок. Если ошибки всё-таки есть, то смотрим, что произошло и при необходимости натравливаем iconv > Спасибо всем за участие! Особенно тебе, земляк. ;) Пожалуйста! Меня тоже напрягают файлы не в unicode и не в unix-line-endings. При попытке работать с такими с помощью while; read, awk, да почти всеми текстовыми утилитами, начинается такая катавасия, что боже упаси. -- Bright regards, Sergey Korobitsin, Chief Research Officer Arta Software, http://arta.kz/ xmpp:undertaker@jabber.arta.kz -- Пифагоровы штаны Лобачевскому смешны --