* [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом)
@ 2008-03-04 3:38 Alexey Tourbin
2008-03-04 7:36 ` Alexey Rusakov
2008-03-04 10:15 ` Vitaly Ostanin
0 siblings, 2 replies; 8+ messages in thread
From: Alexey Tourbin @ 2008-03-04 3:38 UTC (permalink / raw)
To: devel
[-- Attachment #1: Type: text/plain, Size: 729 bytes --]
При сборке пакета perl-Image-Info я заметил что активизируется сеть.
Там есть тестовый SVG рисунок, в котором написано
<!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">
и он при загрузке риснука лезет выкачивать этот урл и там дальше через
ENTITY выкачивает ещё штук 20 файлов.
Думаю, что один из наиболее распространённых случаев непроизвольного
использования сети при сбокре пакетов (и вообще) -- это как раз разбор
XML. Надо с этим что-то делать.
Вообще-то у нас есть пакет xml-common и /etc/xml/catalog,
куда можно класть стандартные спецификации. Тогда libxml2 будет
брать их оттуда.
Может кто-нибудь знает как лучше запаковать основные DTD или что там?!
[-- Attachment #2: Type: application/pgp-signature, Size: 197 bytes --]
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом)
2008-03-04 3:38 [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом) Alexey Tourbin
@ 2008-03-04 7:36 ` Alexey Rusakov
2008-03-04 8:17 ` Alexey Tourbin
2008-03-04 10:15 ` Vitaly Ostanin
1 sibling, 1 reply; 8+ messages in thread
From: Alexey Rusakov @ 2008-03-04 7:36 UTC (permalink / raw)
To: devel
On Tue, 4 Mar 2008 06:38:04 +0300
Alexey Tourbin wrote:
> При сборке пакета perl-Image-Info я заметил что активизируется сеть.
> Там есть тестовый SVG рисунок, в котором написано
> <!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN"
> "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd"> и он при загрузке
> риснука лезет выкачивать этот урл и там дальше через ENTITY выкачивает
> ещё штук 20 файлов.
>
> Думаю, что один из наиболее распространённых случаев непроизвольного
> использования сети при сбокре пакетов (и вообще) -- это как раз разбор
> XML. Надо с этим что-то делать.
>
> Вообще-то у нас есть пакет xml-common и /etc/xml/catalog,
> куда можно класть стандартные спецификации. Тогда libxml2 будет
> брать их оттуда.
>
> Может кто-нибудь знает как лучше запаковать основные DTD или что там?!
Проблема, кстати, очень актуальная - буквально вчера я попросил viy@
заняться несколькими пакетами, лезущими по тем же причинам в сеть при
сборке.
--
Alexey "Ktirf" Rusakov
Head of System development dept.
ALT Linux Ltd.
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом)
2008-03-04 7:36 ` Alexey Rusakov
@ 2008-03-04 8:17 ` Alexey Tourbin
2008-03-07 16:40 ` Alexey Rusakov
0 siblings, 1 reply; 8+ messages in thread
From: Alexey Tourbin @ 2008-03-04 8:17 UTC (permalink / raw)
To: devel
[-- Attachment #1: Type: text/plain, Size: 358 bytes --]
On Tue, Mar 04, 2008 at 10:36:47AM +0300, Alexey Rusakov wrote:
> > Может кто-нибудь знает как лучше запаковать основные DTD или что там?!
> Проблема, кстати, очень актуальная - буквально вчера я попросил viy@
> заняться несколькими пакетами, лезущими по тем же причинам в сеть при
> сборке.
Подробнее. Что за пакеты и какие DTD в них вытягиваются.
[-- Attachment #2: Type: application/pgp-signature, Size: 197 bytes --]
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом)
2008-03-04 8:17 ` Alexey Tourbin
@ 2008-03-07 16:40 ` Alexey Rusakov
0 siblings, 0 replies; 8+ messages in thread
From: Alexey Rusakov @ 2008-03-07 16:40 UTC (permalink / raw)
To: devel
On Tue, 4 Mar 2008 11:17:04 +0300
Alexey Tourbin wrote:
> On Tue, Mar 04, 2008 at 10:36:47AM +0300, Alexey Rusakov wrote:
> > > Может кто-нибудь знает как лучше запаковать основные DTD или что
> > > там?!
> > Проблема, кстати, очень актуальная - буквально вчера я попросил viy@
> > заняться несколькими пакетами, лезущими по тем же причинам в сеть при
> > сборке.
>
> Подробнее. Что за пакеты и какие DTD в них вытягиваются.
Сорри, при ближайшем рассмотрении это оказалась не DTD, а XSLT. Пакет
называется mx4j, и в нём при сборке документации используется
Docbook'овский stylesheet, скачиваемый из инета.
--
Alexey "Ktirf" Rusakov
Head of Systems development dept.
ALT Linux Technology
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом)
2008-03-04 3:38 [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом) Alexey Tourbin
2008-03-04 7:36 ` Alexey Rusakov
@ 2008-03-04 10:15 ` Vitaly Ostanin
2008-03-04 10:27 ` Alexey Tourbin
1 sibling, 1 reply; 8+ messages in thread
From: Vitaly Ostanin @ 2008-03-04 10:15 UTC (permalink / raw)
To: ALT Linux Team development discussions
[-- Attachment #1: Type: text/plain, Size: 1012 bytes --]
Alexey Tourbin пишет:
> При сборке пакета perl-Image-Info я заметил что активизируется сеть.
> Там есть тестовый SVG рисунок, в котором написано
> <!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">
> и он при загрузке риснука лезет выкачивать этот урл и там дальше через
> ENTITY выкачивает ещё штук 20 файлов.
Кто именно лезет? У утилит libxml2 есть переключатель --nonet,
который запрещает entity resolver'у лазать в сеть.
> Думаю, что один из наиболее распространённых случаев непроизвольного
> использования сети при сбокре пакетов (и вообще) -- это как раз разбор
> XML. Надо с этим что-то делать.
>
> Вообще-то у нас есть пакет xml-common и /etc/xml/catalog,
> куда можно класть стандартные спецификации. Тогда libxml2 будет
> брать их оттуда.
>
> Может кто-нибудь знает как лучше запаковать основные DTD или что там?!
Так же, как docbook-dtds.
--
Regards, Vyt
mailto: vyt@altlinux.org
JID: vitaly.ostanin@gmail.com
[-- Attachment #2: OpenPGP digital signature --]
[-- Type: application/pgp-signature, Size: 252 bytes --]
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом)
2008-03-04 10:15 ` Vitaly Ostanin
@ 2008-03-04 10:27 ` Alexey Tourbin
2008-03-04 12:00 ` Vitaly Ostanin
0 siblings, 1 reply; 8+ messages in thread
From: Alexey Tourbin @ 2008-03-04 10:27 UTC (permalink / raw)
To: ALT Linux Team development discussions
[-- Attachment #1: Type: text/plain, Size: 2117 bytes --]
On Tue, Mar 04, 2008 at 01:15:16PM +0300, Vitaly Ostanin wrote:
> Alexey Tourbin пишет:
> > При сборке пакета perl-Image-Info я заметил что активизируется сеть.
> > Там есть тестовый SVG рисунок, в котором написано
> > <!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">
> > и он при загрузке риснука лезет выкачивать этот урл и там дальше через
> > ENTITY выкачивает ещё штук 20 файлов.
>
> Кто именно лезет? У утилит libxml2 есть переключатель --nonet,
> который запрещает entity resolver'у лазать в сеть.
Где-то во внутренностях libxml2 лезет -- разобраться нелегко.
Явно не в перловом коде, перловый код я трейсил.
$ echo ${PWD##*/}
Image-Info-1.27
$ perl -MXML::Simple -e 'XMLin(shift)' img/graph.svg
$ sudo tail /var/log/squid/access.log
1204626173.381 0 127.0.0.1 TCP_HIT/200 3629 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-clip.mod - NONE/- text/plain
1204626173.405 0 127.0.0.1 TCP_HIT/200 4754 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-mask.mod - NONE/- text/plain
1204626173.430 1 127.0.0.1 TCP_HIT/200 27430 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-filter.mod - NONE/- text/plain
1204626173.458 0 127.0.0.1 TCP_HIT/200 2851 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-cursor.mod - NONE/- text/plain
1204626173.482 0 127.0.0.1 TCP_HIT/200 4451 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-hyperlink.mod - NONE/- text/plain
1204626173.506 0 127.0.0.1 TCP_HIT/200 2457 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-view.mod - NONE/- text/plain
1204626173.530 0 127.0.0.1 TCP_HIT/200 2404 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-script.mod - NONE/- text/plain
1204626173.555 0 127.0.0.1 TCP_HIT/200 8946 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-animation.mod - NONE/- text/plain
1204626173.581 0 127.0.0.1 TCP_HIT/200 13285 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-font.mod - NONE/- text/plain
1204626173.608 0 127.0.0.1 TCP_HIT/200 4198 GET http://www.w3.org/Graphics/SVG/1.1/DTD/svg-extensibility.mod - NONE/- text/plain
$
[-- Attachment #2: Type: application/pgp-signature, Size: 197 bytes --]
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом)
2008-03-04 10:27 ` Alexey Tourbin
@ 2008-03-04 12:00 ` Vitaly Ostanin
2008-03-04 12:07 ` Alexey Tourbin
0 siblings, 1 reply; 8+ messages in thread
From: Vitaly Ostanin @ 2008-03-04 12:00 UTC (permalink / raw)
To: ALT Linux Team development discussions
[-- Attachment #1: Type: text/plain, Size: 1030 bytes --]
Alexey Tourbin пишет:
> On Tue, Mar 04, 2008 at 01:15:16PM +0300, Vitaly Ostanin wrote:
>> Alexey Tourbin пишет:
>>> При сборке пакета perl-Image-Info я заметил что активизируется сеть.
>>> Там есть тестовый SVG рисунок, в котором написано
>>> <!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">
>>> и он при загрузке риснука лезет выкачивать этот урл и там дальше через
>>> ENTITY выкачивает ещё штук 20 файлов.
>> Кто именно лезет? У утилит libxml2 есть переключатель --nonet,
>> который запрещает entity resolver'у лазать в сеть.
>
> Где-то во внутренностях libxml2 лезет -- разобраться нелегко.
Можно посмотреть в xmllint.c:
xmlSetExternalEntityLoader(xmlNoNetExternalEntityLoader);
Видимо, нужно научить perl bindings такому переключателю, или
перед сборкой проверять xml файлы на валидность 'xmllint
--nonet', чтобы убедиться, что из сети ничего не нужно.
<skipped/>
--
Regards, Vyt
mailto: vyt@altlinux.org
JID: vitaly.ostanin@gmail.com
[-- Attachment #2: OpenPGP digital signature --]
[-- Type: application/pgp-signature, Size: 252 bytes --]
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом)
2008-03-04 12:00 ` Vitaly Ostanin
@ 2008-03-04 12:07 ` Alexey Tourbin
0 siblings, 0 replies; 8+ messages in thread
From: Alexey Tourbin @ 2008-03-04 12:07 UTC (permalink / raw)
To: ALT Linux Team development discussions
[-- Attachment #1: Type: text/plain, Size: 1350 bytes --]
On Tue, Mar 04, 2008 at 03:00:53PM +0300, Vitaly Ostanin wrote:
> Alexey Tourbin пишет:
> > On Tue, Mar 04, 2008 at 01:15:16PM +0300, Vitaly Ostanin wrote:
> >> Alexey Tourbin пишет:
> >>> При сборке пакета perl-Image-Info я заметил что активизируется сеть.
> >>> Там есть тестовый SVG рисунок, в котором написано
> >>> <!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">
> >>> и он при загрузке риснука лезет выкачивать этот урл и там дальше через
> >>> ENTITY выкачивает ещё штук 20 файлов.
> >> Кто именно лезет? У утилит libxml2 есть переключатель --nonet,
> >> который запрещает entity resolver'у лазать в сеть.
> >
> > Где-то во внутренностях libxml2 лезет -- разобраться нелегко.
>
> Можно посмотреть в xmllint.c:
> xmlSetExternalEntityLoader(xmlNoNetExternalEntityLoader);
>
> Видимо, нужно научить perl bindings такому переключателю, или
> перед сборкой проверять xml файлы на валидность 'xmllint
> --nonet', чтобы убедиться, что из сети ничего не нужно.
Это закручено по очень длинной цепочке:
Image::Info::SVG -> XML::Simple -> XML::SAX -> XML::LibXML -> libxml2
При этом не совсем понятно, что в каком месте и что именно
в этой цепочке надо отрубить. По крайней мере предполагаю
что допустимо будет отрубить DTD валидацию в XML::Simple.
А может быть и нет.
[-- Attachment #2: Type: application/pgp-signature, Size: 197 bytes --]
^ permalink raw reply [flat|nested] 8+ messages in thread
end of thread, other threads:[~2008-03-07 16:40 UTC | newest]
Thread overview: 8+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2008-03-04 3:38 [devel] xml/catalog -- libxml2 лезет в сеть (телеграфом) Alexey Tourbin
2008-03-04 7:36 ` Alexey Rusakov
2008-03-04 8:17 ` Alexey Tourbin
2008-03-07 16:40 ` Alexey Rusakov
2008-03-04 10:15 ` Vitaly Ostanin
2008-03-04 10:27 ` Alexey Tourbin
2008-03-04 12:00 ` Vitaly Ostanin
2008-03-04 12:07 ` Alexey Tourbin
ALT Linux Team development discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
public-inbox-index devel
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.devel
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git