* [Comm] Конвертирование html
@ 2008-01-04 19:05 Александр
2008-01-09 9:23 ` Андрей Черепанов
0 siblings, 1 reply; 6+ messages in thread
From: Александр @ 2008-01-04 19:05 UTC (permalink / raw)
To: community
Hello all,
Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
важно).
С уважением, Александр.
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [Comm] Конвертирование html
2008-01-04 19:05 [Comm] Конвертирование html Александр
@ 2008-01-09 9:23 ` Андрей Черепанов
2008-01-09 9:37 ` Алексей Шенцев
0 siblings, 1 reply; 6+ messages in thread
From: Андрей Черепанов @ 2008-01-09 9:23 UTC (permalink / raw)
To: ALT Linux Community general discussions
4 января 2008 Александр написал:
> Hello all,
>
> Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
> Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
> важно).
cat'ом слить в один файл и открыть в OpenOffice.org?
--
Андрей Черепанов
ALT Linux
cas@altlinux.ru
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [Comm] Конвертирование html
2008-01-09 9:23 ` Андрей Черепанов
@ 2008-01-09 9:37 ` Алексей Шенцев
2008-01-09 10:36 ` Андрей Черепанов
0 siblings, 1 reply; 6+ messages in thread
From: Алексей Шенцев @ 2008-01-09 9:37 UTC (permalink / raw)
To: ALT Linux Community general discussions
В сообщении от Wednesday 09 January 2008 12:23:47 Андрей Черепанов написал(а):
> 4 января 2008 Александр написал:
> > Hello all,
> >
> > Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
> > Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
> > важно).
>
> cat'ом слить в один файл и открыть в OpenOffice.org?
Не канает. В таком случае теряется вся целостность документа (ов). Андрей,
попробуйте слить воедино, как предложили, все html-страницы документации из
бранча. Интересно какая каша у вас получится? ... :)
OpenOffice умеет открывать html-страницы. Соотвественно их можно сохранить в
любом ином формате. Но вот я сейчас попробовал открыть
страницу /usr/share/doc/HTML/index.html
Открылась. А вот дальше по ссылкам вызывается вэб-браузер.
--
С уважением Шенцев Алексей Владимирович.
E-mail: ashen@nsrz.ru
XMPP: ashen@altlinux.org, AlexShen@jabber.ru
ICQ: 271053845
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [Comm] Конвертирование html
2008-01-09 9:37 ` Алексей Шенцев
@ 2008-01-09 10:36 ` Андрей Черепанов
2008-01-09 11:04 ` Slava Dubrovskiy
0 siblings, 1 reply; 6+ messages in thread
From: Андрей Черепанов @ 2008-01-09 10:36 UTC (permalink / raw)
To: ALT Linux Community general discussions
9 января 2008 Алексей Шенцев написал:
> В сообщении от Wednesday 09 January 2008 12:23:47 Андрей Черепанов
написал(а):
> > 4 января 2008 Александр написал:
> > > Hello all,
> > >
> > > Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
> > > Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
> > > важно).
> >
> > cat'ом слить в один файл и открыть в OpenOffice.org?
>
> Не канает. В таком случае теряется вся целостность документа (ов). Андрей,
> попробуйте слить воедино, как предложили, все html-страницы документации из
> бранча. Интересно какая каша у вас получится? ... :)
> OpenOffice умеет открывать html-страницы. Соотвественно их можно сохранить
> в любом ином формате. Но вот я сейчас попробовал открыть
> страницу /usr/share/doc/HTML/index.html
> Открылась. А вот дальше по ссылкам вызывается вэб-браузер.
Естественно, а что вы хотите? Для нормального получения единым файлом нужно:
- изначально писать в docbook документацию
- писать самостоятельно парсер для кучи HTML
- скачивать wget с конвертацией ссылок
- генерировать chm или war из кучи файлов
--
Андрей Черепанов
ALT Linux
cas@altlinux.ru
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [Comm] Конвертирование html
2008-01-09 10:36 ` Андрей Черепанов
@ 2008-01-09 11:04 ` Slava Dubrovskiy
2008-01-09 11:15 ` Алексей Шенцев
0 siblings, 1 reply; 6+ messages in thread
From: Slava Dubrovskiy @ 2008-01-09 11:04 UTC (permalink / raw)
To: ALT Linux Community general discussions
[-- Attachment #1: Type: text/plain, Size: 1875 bytes --]
Андрей Черепанов пишет:
>>>> Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
>>>> Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
>>>> важно).
>>>>
>>> cat'ом слить в один файл и открыть в OpenOffice.org?
>>>
>> Не канает. В таком случае теряется вся целостность документа (ов). Андрей,
>> попробуйте слить воедино, как предложили, все html-страницы документации из
>> бранча. Интересно какая каша у вас получится? ... :)
>> OpenOffice умеет открывать html-страницы. Соотвественно их можно сохранить
>> в любом ином формате. Но вот я сейчас попробовал открыть
>> страницу /usr/share/doc/HTML/index.html
>> Открылась. А вот дальше по ссылкам вызывается вэб-браузер.
>>
> Естественно, а что вы хотите? Для нормального получения единым файлом нужно:
> - изначально писать в docbook документацию
> - писать самостоятельно парсер для кучи HTML
> - скачивать wget с конвертацией ссылок
> - генерировать chm или war из кучи файлов
>
Что-то вы велосипед изобретаете. Когда-то была Htmldoc и много чего из
этого делала. Вытащите из orphaned и будет счастье.
--
WBR,
Dubrovskiy Vyacheslav
[-- Attachment #2: S/MIME Cryptographic Signature --]
[-- Type: application/x-pkcs7-signature, Size: 3249 bytes --]
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [Comm] Конвертирование html
2008-01-09 11:04 ` Slava Dubrovskiy
@ 2008-01-09 11:15 ` Алексей Шенцев
0 siblings, 0 replies; 6+ messages in thread
From: Алексей Шенцев @ 2008-01-09 11:15 UTC (permalink / raw)
To: slava, ALT Linux Community general discussions
В сообщении от Wednesday 09 January 2008 14:04:10 Slava Dubrovskiy написал(а):
> Что-то вы велосипед изобретаете. Когда-то была Htmldoc и много чего из
> этого делала. Вытащите из orphaned и будет счастье.
Точно, Слав. Псиб.
А ещё есть html2text. Не много не по теме, но близко.
--
С уважением Шенцев Алексей Владимирович.
E-mail: ashen@nsrz.ru
XMPP: ashen@altlinux.org, AlexShen@jabber.ru
ICQ: 271053845
^ permalink raw reply [flat|nested] 6+ messages in thread
end of thread, other threads:[~2008-01-09 11:15 UTC | newest]
Thread overview: 6+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2008-01-04 19:05 [Comm] Конвертирование html Александр
2008-01-09 9:23 ` Андрей Черепанов
2008-01-09 9:37 ` Алексей Шенцев
2008-01-09 10:36 ` Андрей Черепанов
2008-01-09 11:04 ` Slava Dubrovskiy
2008-01-09 11:15 ` Алексей Шенцев
ALT Linux Community general discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
public-inbox-index community
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.community
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git