From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: From: Led To: ALT Linux Sisyphus discussion list Date: Wed, 29 Nov 2006 10:46:16 +0200 User-Agent: KMail/1.9.5 References: <20061128160707.GA766@basalt.office.altlinux.org> <20061128214848.GA866@lks.home> In-Reply-To: MIME-Version: 1.0 Content-Type: text/plain; charset="koi8-r" Content-Transfer-Encoding: 8bit Content-Disposition: inline Message-Id: <200611291046.16814.led@ukr-fin.com.ua> Subject: Re: [sisyphus] [Sisyphus-cybertalk] I: Sisyphus-20061128 packages: +3! +13 (5661) X-BeenThere: sisyphus@lists.altlinux.org X-Mailman-Version: 2.1.9rc1 Precedence: list Reply-To: ALT Linux Sisyphus discussion list List-Id: ALT Linux Sisyphus discussion list List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Wed, 29 Nov 2006 08:46:29 -0000 Archived-At: List-Archive: List-Post: В сообщении от 29 ноября 2006 10:03 Eugene Ostapets написал(a): > 28.11.06, Konstantin A. Lepikhov написал(а): > > Hi Eugene! > > > > Tuesday 28, at 11:00:37 PM you wrote: > > > 28.11.06, QA Team Robot написал(а): > > > > 3 ADDED packages > > > > pdftohtml - pdftohtml is a utility which converts PDF files into HTML > > > > and XML formats. * Mon Nov 27 2006 Eugene Ostapets > > > > 0.40a-alt1 - first build > > > > > > Очень рекомендую всем, кому нужно получить нормальный текст из pdf - > > > проверил на десятке очень сложных pdf файлов и получил в итоге > > > практически идентичные html страницы. Но в html лучше не заглядывать, > > > во избежание нервного потрясения:) > > > > да, что там она выделывает, лучше не смотреть, особенно картинки вместо > > цифр-сносок :) > > Я долго искал что-то, что способно русский pdf превратить в читаемый > html... Теперь буду искать что-то способное превратить ТАКОЙ html в > редактируемый:) Из того, что я пробовал, наиболее адекватный результат "понимания" PDF выдавал kword (как ни странно)... -- Led.