ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] Конвертирование html
@ 2008-01-04 19:05 Александр
  2008-01-09  9:23 ` Андрей Черепанов
  0 siblings, 1 reply; 6+ messages in thread
From: Александр @ 2008-01-04 19:05 UTC (permalink / raw)
  To: community

Hello all,

Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
важно).

С уважением, Александр.


^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Comm] Конвертирование html
  2008-01-04 19:05 [Comm] Конвертирование html Александр
@ 2008-01-09  9:23 ` Андрей Черепанов
  2008-01-09  9:37   ` Алексей Шенцев
  0 siblings, 1 reply; 6+ messages in thread
From: Андрей Черепанов @ 2008-01-09  9:23 UTC (permalink / raw)
  To: ALT Linux Community general discussions

4 января 2008 Александр написал:
> Hello all,
>
> Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
> Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
> важно).
cat'ом слить в один файл и открыть в OpenOffice.org?

-- 
Андрей Черепанов
ALT Linux
cas@altlinux.ru

^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Comm] Конвертирование html
  2008-01-09  9:23 ` Андрей Черепанов
@ 2008-01-09  9:37   ` Алексей Шенцев
  2008-01-09 10:36     ` Андрей Черепанов
  0 siblings, 1 reply; 6+ messages in thread
From: Алексей Шенцев @ 2008-01-09  9:37 UTC (permalink / raw)
  To: ALT Linux Community general discussions

В сообщении от Wednesday 09 January 2008 12:23:47 Андрей Черепанов написал(а):
> 4 января 2008 Александр написал:
> > Hello all,
> >
> > Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
> > Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
> > важно).
>
> cat'ом слить в один файл и открыть в OpenOffice.org?
Не канает. В таком случае теряется вся целостность документа (ов). Андрей, 
попробуйте слить воедино, как предложили, все html-страницы документации из 
бранча. Интересно какая каша у вас получится? ... :)
OpenOffice умеет открывать html-страницы. Соотвественно их можно сохранить в 
любом ином формате. Но вот я сейчас попробовал открыть 
страницу /usr/share/doc/HTML/index.html
Открылась. А вот дальше по ссылкам вызывается вэб-браузер.
-- 
С уважением Шенцев Алексей Владимирович.
E-mail: ashen@nsrz.ru
XMPP: ashen@altlinux.org, AlexShen@jabber.ru
ICQ: 271053845

^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Comm] Конвертирование html
  2008-01-09  9:37   ` Алексей Шенцев
@ 2008-01-09 10:36     ` Андрей Черепанов
  2008-01-09 11:04       ` Slava Dubrovskiy
  0 siblings, 1 reply; 6+ messages in thread
From: Андрей Черепанов @ 2008-01-09 10:36 UTC (permalink / raw)
  To: ALT Linux Community general discussions

9 января 2008 Алексей Шенцев написал:
> В сообщении от Wednesday 09 January 2008 12:23:47 Андрей Черепанов 
написал(а):
> > 4 января 2008 Александр написал:
> > > Hello all,
> > >
> > > Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
> > > Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
> > > важно).
> >
> > cat'ом слить в один файл и открыть в OpenOffice.org?
>
> Не канает. В таком случае теряется вся целостность документа (ов). Андрей,
> попробуйте слить воедино, как предложили, все html-страницы документации из
> бранча. Интересно какая каша у вас получится? ... :)
> OpenOffice умеет открывать html-страницы. Соотвественно их можно сохранить
> в любом ином формате. Но вот я сейчас попробовал открыть
> страницу /usr/share/doc/HTML/index.html
> Открылась. А вот дальше по ссылкам вызывается вэб-браузер.
Естественно, а что вы хотите? Для нормального получения единым файлом нужно: 
- изначально писать в docbook документацию 
- писать самостоятельно парсер для кучи HTML 
- скачивать wget с конвертацией ссылок
- генерировать chm или war из кучи файлов

-- 
Андрей Черепанов
ALT Linux
cas@altlinux.ru

^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Comm] Конвертирование html
  2008-01-09 10:36     ` Андрей Черепанов
@ 2008-01-09 11:04       ` Slava Dubrovskiy
  2008-01-09 11:15         ` Алексей Шенцев
  0 siblings, 1 reply; 6+ messages in thread
From: Slava Dubrovskiy @ 2008-01-09 11:04 UTC (permalink / raw)
  To: ALT Linux Community general discussions

[-- Attachment #1: Type: text/plain, Size: 1875 bytes --]

Андрей Черепанов пишет:
>>>> Кто подскажет? Есть локальный файл скачанный wget. Внем куча страничек.
>>>> Чем можно это все конвертировать в один файл (.doc,.pdf в общем не
>>>> важно).
>>>>         
>>> cat'ом слить в один файл и открыть в OpenOffice.org?
>>>       
>> Не канает. В таком случае теряется вся целостность документа (ов). Андрей,
>> попробуйте слить воедино, как предложили, все html-страницы документации из
>> бранча. Интересно какая каша у вас получится? ... :)
>> OpenOffice умеет открывать html-страницы. Соотвественно их можно сохранить
>> в любом ином формате. Но вот я сейчас попробовал открыть
>> страницу /usr/share/doc/HTML/index.html
>> Открылась. А вот дальше по ссылкам вызывается вэб-браузер.
>>     
> Естественно, а что вы хотите? Для нормального получения единым файлом нужно: 
> - изначально писать в docbook документацию 
> - писать самостоятельно парсер для кучи HTML 
> - скачивать wget с конвертацией ссылок
> - генерировать chm или war из кучи файлов
>   
Что-то вы велосипед изобретаете. Когда-то была Htmldoc и много чего из
этого делала. Вытащите из orphaned и будет счастье.

-- 
WBR,
Dubrovskiy Vyacheslav


[-- Attachment #2: S/MIME Cryptographic Signature --]
[-- Type: application/x-pkcs7-signature, Size: 3249 bytes --]

^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Comm] Конвертирование html
  2008-01-09 11:04       ` Slava Dubrovskiy
@ 2008-01-09 11:15         ` Алексей Шенцев
  0 siblings, 0 replies; 6+ messages in thread
From: Алексей Шенцев @ 2008-01-09 11:15 UTC (permalink / raw)
  To: slava, ALT Linux Community general discussions

В сообщении от Wednesday 09 January 2008 14:04:10 Slava Dubrovskiy написал(а):
> Что-то вы велосипед изобретаете. Когда-то была Htmldoc и много чего из
> этого делала. Вытащите из orphaned и будет счастье.
Точно, Слав. Псиб.
А ещё есть html2text. Не много не по теме, но близко.
-- 
С уважением Шенцев Алексей Владимирович.
E-mail: ashen@nsrz.ru
XMPP: ashen@altlinux.org, AlexShen@jabber.ru
ICQ: 271053845

^ permalink raw reply	[flat|nested] 6+ messages in thread

end of thread, other threads:[~2008-01-09 11:15 UTC | newest]

Thread overview: 6+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2008-01-04 19:05 [Comm] Конвертирование html Александр
2008-01-09  9:23 ` Андрей Черепанов
2008-01-09  9:37   ` Алексей Шенцев
2008-01-09 10:36     ` Андрей Черепанов
2008-01-09 11:04       ` Slava Dubrovskiy
2008-01-09 11:15         ` Алексей Шенцев

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git