* [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
@ 2002-10-23 15:27 Maxim
2002-10-23 15:37 ` Sergey Degtyaryov
0 siblings, 1 reply; 12+ messages in thread
From: Maxim @ 2002-10-23 15:27 UTC (permalink / raw)
To: ALT Linux Mail List
пытаюсь искать строку, но ищет только если точно совпадает, а такая вещь как
игнорирование регистра не проходит.
--
Maxim mailto:max_conf@e-foto.ru
23 октября 2002 г. 19:25
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-23 15:27 [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? Maxim
@ 2002-10-23 15:37 ` Sergey Degtyaryov
2002-10-23 16:36 ` [Comm] Re[2]: " Maxim
2002-10-24 5:20 ` Andrei M. Laptev
0 siblings, 2 replies; 12+ messages in thread
From: Sergey Degtyaryov @ 2002-10-23 15:37 UTC (permalink / raw)
To: community
Доброго дня, Maxim.
23 Октября в 19:27 Вы сказали буквально следующее:
> пытаюсь искать строку, но ищет только если точно совпадает, а
> такая вещь как игнорирование регистра не проходит.
use locale;
--
Rgds, maga, maga@mail.ru
[maga@localhost]$ /usr/games/fortune
Лежит боец, не справился с атакой.
^ permalink raw reply [flat|nested] 12+ messages in thread
* [Comm] Re[2]: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-23 15:37 ` Sergey Degtyaryov
@ 2002-10-23 16:36 ` Maxim
2002-10-24 5:20 ` Andrei M. Laptev
1 sibling, 0 replies; 12+ messages in thread
From: Maxim @ 2002-10-23 16:36 UTC (permalink / raw)
To: Sergey Degtyaryov
Здравствуйте, Sergey.
простота, сестра таланта! :))
Большущее спасибо!
Вы писали 23 октября 2002 г., 19:37:43:
SD> Доброго дня, Maxim.
SD> 23 Октября в 19:27 Вы сказали буквально следующее:
>> пытаюсь искать строку, но ищет только если точно совпадает, а
>> такая вещь как игнорирование регистра не проходит.
SD> use locale;
--
С уважением,
Maxim mailto:max_conf@e-foto.ru
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-23 15:37 ` Sergey Degtyaryov
2002-10-23 16:36 ` [Comm] Re[2]: " Maxim
@ 2002-10-24 5:20 ` Andrei M. Laptev
2002-10-24 11:11 ` Ruslan N. Balkin
1 sibling, 1 reply; 12+ messages in thread
From: Andrei M. Laptev @ 2002-10-24 5:20 UTC (permalink / raw)
To: community
On Wed, 23 Oct 2002 19:37:43 +0400
Sergey Degtyaryov <maga@replay.ru> wrote:
> > пытаюсь искать строку, но ищет только если точно совпадает, а
> > такая вещь как игнорирование регистра не проходит.
>
> use locale;
>
А я вот тоже недавно столкнулся с похожей проблемой, что нужно как то перлу объяснить что он работает с русскими буквами.
вот краткий пример:
----------------8<-------------------------
$perl -e 'while (<>){print "--->$_" if /[а-я]/}'
а
--->а
б
--->б
в
г
--->г
д
--->д
е
--->е
ё
ж
з
и
--->и
й
--->й
----------------8<-------------------------
То есть буквы в,ё,ж,з ну и там еще несколько не попадают под регулярное выражение [а-я], хотя с англиским аналогом [a-z] проблем нет.
Попытки писать use locale или setlocale(LC_ALL,'ru_RU.KOI8-R') у меня эффекта не дали.
Для себя решил проблему просто перечислив все русские буквы в квадратных скобках.
--
С уважением,
Лаптев Андрей
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-24 5:20 ` Andrei M. Laptev
@ 2002-10-24 11:11 ` Ruslan N. Balkin
2002-10-25 4:50 ` Andrei M. Laptev
0 siblings, 1 reply; 12+ messages in thread
From: Ruslan N. Balkin @ 2002-10-24 11:11 UTC (permalink / raw)
To: community
[-- Attachment #1: Type: text/plain, Size: 473 bytes --]
On Thu, 24 Oct 2002 10:20:29 +0500
Andrei wrote:
> То есть буквы в,ё,ж,з ну и там еще несколько не попадают под регулярное
> выражение [а-я], хотя с англиским аналогом [a-z] проблем нет. Попытки
> писать use locale или setlocale(LC_ALL,'ru_RU.KOI8-R') у меня эффекта не
> дали.
KOI8 однако, видимо проблема в том, что не подряд идут.
> Для себя решил проблему просто перечислив все русские буквы в квадратных
> скобках.
>
--
С уважением,
Балькин Руслан.
[-- Attachment #2: For security, this message has been digitally signed. --]
[-- Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-24 11:11 ` Ruslan N. Balkin
@ 2002-10-25 4:50 ` Andrei M. Laptev
2002-10-25 11:16 ` Ruslan N. Balkin
2002-10-25 18:42 ` Karpov A.
0 siblings, 2 replies; 12+ messages in thread
From: Andrei M. Laptev @ 2002-10-25 4:50 UTC (permalink / raw)
To: community
On Thu, 24 Oct 2002 15:11:49 +0400
"Ruslan N. Balkin" <baron@dartel.ru> wrote:
> KOI8 однако, видимо проблема в том, что не подряд идут.
Дык я всегда счтал что грамотно настроенная локаль и должна решать в том
числе и проблемы KOI8, с буковками расположенными не подряд. Весь вопрос
как это сказать перлу, чтоб при сортировке учитывал установки локали.
--
С уважением,
Лаптев Андрей
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-25 4:50 ` Andrei M. Laptev
@ 2002-10-25 11:16 ` Ruslan N. Balkin
2002-10-25 18:42 ` Karpov A.
1 sibling, 0 replies; 12+ messages in thread
From: Ruslan N. Balkin @ 2002-10-25 11:16 UTC (permalink / raw)
To: community
[-- Attachment #1: Type: text/plain, Size: 544 bytes --]
On Fri, 25 Oct 2002 09:50:54 +0500
Andrei wrote:
> On Thu, 24 Oct 2002 15:11:49 +0400
> "Ruslan N. Balkin" <baron@dartel.ru> wrote:
>
> > KOI8 однако, видимо проблема в том, что не подряд идут.
> Дык я всегда счтал что грамотно настроенная локаль и должна решать в том
> числе и проблемы KOI8, с буковками расположенными не подряд. Весь вопрос
> как это сказать перлу, чтоб при сортировке учитывал установки локали.
При сортировке:
use locale;
Если сами пишете - то это Ваши проблемы :)
--
С уважением,
Балькин Руслан.
[-- Attachment #2: For security, this message has been digitally signed. --]
[-- Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-25 4:50 ` Andrei M. Laptev
2002-10-25 11:16 ` Ruslan N. Balkin
@ 2002-10-25 18:42 ` Karpov A.
2002-10-25 21:08 ` Sergey V. Degtyaryov
1 sibling, 1 reply; 12+ messages in thread
From: Karpov A. @ 2002-10-25 18:42 UTC (permalink / raw)
To: community
Andrei M. Laptev пишет:
>>KOI8 однако, видимо проблема в том, что не подряд идут.
>>
>>
>Дык я всегда счтал что грамотно настроенная локаль и должна решать в том
>числе и проблемы KOI8, с буковками расположенными не подряд. Весь вопрос
>как это сказать перлу, чтоб при сортировке учитывал установки локали.
>
>
У меня, например, если скрипт типа
========
#!/usr/bin/perl
use locale;
print lc('яЯяЯ');
=========
то все работает, а вот если внутри навороченного скрипта с кучей всяких
useов, то уже нет :(
и такие проблемы решаю как ранее сказали - tr/ЁЙЦУ.../ёйцу.../
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-25 18:42 ` Karpov A.
@ 2002-10-25 21:08 ` Sergey V. Degtyaryov
2002-10-25 22:00 ` Ruslan N. Balkin
0 siblings, 1 reply; 12+ messages in thread
From: Sergey V. Degtyaryov @ 2002-10-25 21:08 UTC (permalink / raw)
To: community
Доброго дня, Karpov.
25 Октября в 22:42 Вы сказали буквально следующее:
> >>KOI8 однако, видимо проблема в том, что не подряд идут.
> >>
> >Дык я всегда счтал что грамотно настроенная локаль и должна
> >решать в том числе и проблемы KOI8, с буковками расположенными
> >не подряд. Весь вопрос как это сказать перлу, чтоб при
> >сортировке учитывал установки локали.
Да, я сразу не подтвердил, сорри.
[а-я] не соответствует действительности.
Проверил на 3-х ALT.
use locale вовсе не use. А если и use, но не locale.
--
Сергей
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-25 21:08 ` Sergey V. Degtyaryov
@ 2002-10-25 22:00 ` Ruslan N. Balkin
2002-10-25 22:25 ` Sergey V. Degtyaryov
0 siblings, 1 reply; 12+ messages in thread
From: Ruslan N. Balkin @ 2002-10-25 22:00 UTC (permalink / raw)
To: community
[-- Attachment #1: Type: text/plain, Size: 1812 bytes --]
On Sat, 26 Oct 2002 01:08:09 +0400
Sergey wrote:
> Доброго дня, Karpov.
> 25 Октября в 22:42 Вы сказали буквально следующее:
>
> > >>KOI8 однако, видимо проблема в том, что не подряд идут.
> > >>
> > >Дык я всегда счтал что грамотно настроенная локаль и должна
> > >решать в том числе и проблемы KOI8, с буковками расположенными
> > >не подряд. Весь вопрос как это сказать перлу, чтоб при
> > >сортировке учитывал установки локали.
>
> Да, я сразу не подтвердил, сорри.
> [а-я] не соответствует действительности.
> Проверил на 3-х ALT.
> use locale вовсе не use. А если и use, но не locale.
Уверен, с KOI8 работать не будет. Непоследовательно идут буквы.
С perldoc.com, faq по regex:
How can I match a locale-smart version of /[a-zA-Z]/? toc
One alphabetic character would be /[^\W\d_]/, no matter what locale you're
in. Non-alphabetics would be /[\W\d_]/ (assuming you don't consider an
underscore a letter).
И еще в подтверждение моей правоты - из man regex:
A bracket expression is a list of characters enclosed in `[]'. It nor-
mally matches any single character from the list (but see below). If
the list begins with `^', it matches any single character (but see
below) not from the rest of the list. If two characters in the list
are separated by `-', this is shorthand for the full range of charac-
ters between those two (inclusive) in the collating sequence, e.g.
`[0-9]' in ASCII matches any decimal digit. It is illegal(!) for two
ranges to share an endpoint, e.g. `a-c-e'. Ranges are very collating-
sequence-dependent, and portable programs should avoid relying on them.
То есть пользуйтесь use locale; и \w, как и положено, или задавайте ранг
так: [абвгдежзийкл] :)
--
С уважением,
Балькин Руслан.
[-- Attachment #2: For security, this message has been digitally signed. --]
[-- Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-25 22:00 ` Ruslan N. Balkin
@ 2002-10-25 22:25 ` Sergey V. Degtyaryov
2002-10-26 1:50 ` Ruslan N. Balkin
0 siblings, 1 reply; 12+ messages in thread
From: Sergey V. Degtyaryov @ 2002-10-25 22:25 UTC (permalink / raw)
To: community
Доброго дня, Ruslan.
26 Октября в 02:00 Вы сказали буквально следующее:
> То есть пользуйтесь use locale; и \w, как и положено, или
> задавайте ранг так: [абвгдежзийкл] :)
О том и спич.
\w и [а-я] отличаются таки.
И "full range of characters between" [а-я] не включает весь
русский алфавит.
--
Rgds, maga, maga@mail.ru
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
2002-10-25 22:25 ` Sergey V. Degtyaryov
@ 2002-10-26 1:50 ` Ruslan N. Balkin
0 siblings, 0 replies; 12+ messages in thread
From: Ruslan N. Balkin @ 2002-10-26 1:50 UTC (permalink / raw)
To: community
[-- Attachment #1: Type: text/plain, Size: 798 bytes --]
On Sat, 26 Oct 2002 02:25:35 +0400
Sergey wrote:
> Доброго дня, Ruslan.
> 26 Октября в 02:00 Вы сказали буквально следующее:
>
> > То есть пользуйтесь use locale; и \w, как и положено, или
> > задавайте ранг так: [абвгдежзийкл] :)
>
> О том и спич.
> \w и [а-я] отличаются таки.
> И "full range of characters between" [а-я] не включает весь
> русский алфавит.
Вроде бы разговор зашел о том, что perl не поддерживает русские буквы.
На самом деле работает, но так, как описано в документации, а не так, как
хочет программист.
И лично у меня ни разу не было проблем, чтобы perl неверно переводил все
буквы в нижний регистр или что-то в этом роде.
А в вашем случае - четко же написано - range of characters. с кода буквы а
по код буквы я.
--
С уважением,
Балькин Руслан.
[-- Attachment #2: For security, this message has been digitally signed. --]
[-- Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 12+ messages in thread
end of thread, other threads:[~2002-10-26 1:50 UTC | newest]
Thread overview: 12+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2002-10-23 15:27 [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? Maxim
2002-10-23 15:37 ` Sergey Degtyaryov
2002-10-23 16:36 ` [Comm] Re[2]: " Maxim
2002-10-24 5:20 ` Andrei M. Laptev
2002-10-24 11:11 ` Ruslan N. Balkin
2002-10-25 4:50 ` Andrei M. Laptev
2002-10-25 11:16 ` Ruslan N. Balkin
2002-10-25 18:42 ` Karpov A.
2002-10-25 21:08 ` Sergey V. Degtyaryov
2002-10-25 22:00 ` Ruslan N. Balkin
2002-10-25 22:25 ` Sergey V. Degtyaryov
2002-10-26 1:50 ` Ruslan N. Balkin
ALT Linux Community general discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
public-inbox-index community
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.community
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git