ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
@ 2002-10-23 15:27 Maxim
  2002-10-23 15:37 ` Sergey Degtyaryov
  0 siblings, 1 reply; 12+ messages in thread
From: Maxim @ 2002-10-23 15:27 UTC (permalink / raw)
  To: ALT Linux Mail List

пытаюсь искать строку, но ищет только если точно совпадает, а такая вещь как
игнорирование регистра не проходит.

--
 Maxim                                  mailto:max_conf@e-foto.ru
 23 октября 2002 г. 19:25



^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-23 15:27 [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? Maxim
@ 2002-10-23 15:37 ` Sergey Degtyaryov
  2002-10-23 16:36   ` [Comm] Re[2]: " Maxim
  2002-10-24  5:20   ` Andrei M. Laptev
  0 siblings, 2 replies; 12+ messages in thread
From: Sergey Degtyaryov @ 2002-10-23 15:37 UTC (permalink / raw)
  To: community

Доброго дня, Maxim.
23 Октября в 19:27  Вы сказали буквально следующее:

> пытаюсь искать строку, но ищет только если точно совпадает, а
> такая вещь как игнорирование регистра не проходит.

use locale;

-- 
Rgds, maga, maga@mail.ru
[maga@localhost]$ /usr/games/fortune
Лежит боец, не справился с атакой. 



^ permalink raw reply	[flat|nested] 12+ messages in thread

* [Comm] Re[2]: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-23 15:37 ` Sergey Degtyaryov
@ 2002-10-23 16:36   ` Maxim
  2002-10-24  5:20   ` Andrei M. Laptev
  1 sibling, 0 replies; 12+ messages in thread
From: Maxim @ 2002-10-23 16:36 UTC (permalink / raw)
  To: Sergey Degtyaryov

Здравствуйте, Sergey.

простота, сестра таланта! :))
Большущее спасибо!

Вы писали 23 октября 2002 г., 19:37:43:

SD> Доброго дня, Maxim.
SD> 23 Октября в 19:27  Вы сказали буквально следующее:

>> пытаюсь искать строку, но ищет только если точно совпадает, а
>> такая вещь как игнорирование регистра не проходит.

SD> use locale;

-- 
С уважением,
 Maxim                          mailto:max_conf@e-foto.ru



^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-23 15:37 ` Sergey Degtyaryov
  2002-10-23 16:36   ` [Comm] Re[2]: " Maxim
@ 2002-10-24  5:20   ` Andrei M. Laptev
  2002-10-24 11:11     ` Ruslan N. Balkin
  1 sibling, 1 reply; 12+ messages in thread
From: Andrei M. Laptev @ 2002-10-24  5:20 UTC (permalink / raw)
  To: community

On Wed, 23 Oct 2002 19:37:43 +0400
Sergey Degtyaryov <maga@replay.ru> wrote:

> > пытаюсь искать строку, но ищет только если точно совпадает, а
> > такая вещь как игнорирование регистра не проходит.
> 
> use locale;
> 
А я вот тоже недавно столкнулся с похожей проблемой, что нужно как то перлу объяснить что он работает с русскими буквами.
вот краткий пример:
----------------8<-------------------------
$perl -e 'while (<>){print "--->$_" if /[а-я]/}'
а
--->а
б
--->б
в
г
--->г
д
--->д
е
--->е
ё
ж
з
и
--->и
й
--->й
----------------8<-------------------------
То есть буквы в,ё,ж,з ну и там еще несколько не попадают под регулярное выражение [а-я], хотя с англиским аналогом [a-z] проблем нет.
Попытки писать use locale или setlocale(LC_ALL,'ru_RU.KOI8-R') у меня эффекта не дали.

Для себя решил проблему просто перечислив все русские буквы в квадратных скобках.

-- 
С уважением,
Лаптев Андрей


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-24  5:20   ` Andrei M. Laptev
@ 2002-10-24 11:11     ` Ruslan N. Balkin
  2002-10-25  4:50       ` Andrei M. Laptev
  0 siblings, 1 reply; 12+ messages in thread
From: Ruslan N. Balkin @ 2002-10-24 11:11 UTC (permalink / raw)
  To: community

[-- Attachment #1: Type: text/plain, Size: 473 bytes --]

On Thu, 24 Oct 2002 10:20:29 +0500
Andrei wrote:

> То есть буквы в,ё,ж,з ну и там еще несколько не попадают под регулярное
> выражение [а-я], хотя с англиским аналогом [a-z] проблем нет. Попытки
> писать use locale или setlocale(LC_ALL,'ru_RU.KOI8-R') у меня эффекта не
> дали.
KOI8 однако, видимо проблема в том, что не подряд идут.
> Для себя решил проблему просто перечислив все русские буквы в квадратных
> скобках.
> 


-- 
С уважением,
Балькин Руслан.

[-- Attachment #2: For security, this message has been digitally signed. --]
[-- Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-24 11:11     ` Ruslan N. Balkin
@ 2002-10-25  4:50       ` Andrei M. Laptev
  2002-10-25 11:16         ` Ruslan N. Balkin
  2002-10-25 18:42         ` Karpov A.
  0 siblings, 2 replies; 12+ messages in thread
From: Andrei M. Laptev @ 2002-10-25  4:50 UTC (permalink / raw)
  To: community

On Thu, 24 Oct 2002 15:11:49 +0400
"Ruslan N. Balkin" <baron@dartel.ru> wrote:

> KOI8 однако, видимо проблема в том, что не подряд идут.
Дык я всегда счтал что грамотно настроенная локаль и должна решать в том 
числе и проблемы KOI8, с буковками расположенными не подряд. Весь вопрос 
как это сказать перлу, чтоб при сортировке учитывал установки локали.
-- 
С уважением,
Лаптев Андрей


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-25  4:50       ` Andrei M. Laptev
@ 2002-10-25 11:16         ` Ruslan N. Balkin
  2002-10-25 18:42         ` Karpov A.
  1 sibling, 0 replies; 12+ messages in thread
From: Ruslan N. Balkin @ 2002-10-25 11:16 UTC (permalink / raw)
  To: community

[-- Attachment #1: Type: text/plain, Size: 544 bytes --]

On Fri, 25 Oct 2002 09:50:54 +0500
Andrei wrote:

> On Thu, 24 Oct 2002 15:11:49 +0400
> "Ruslan N. Balkin" <baron@dartel.ru> wrote:
> 
> > KOI8 однако, видимо проблема в том, что не подряд идут.
> Дык я всегда счтал что грамотно настроенная локаль и должна решать в том 
> числе и проблемы KOI8, с буковками расположенными не подряд. Весь вопрос 
> как это сказать перлу, чтоб при сортировке учитывал установки локали.
При сортировке:
use locale;

Если сами пишете - то это Ваши проблемы :)


-- 
С уважением,
Балькин Руслан.

[-- Attachment #2: For security, this message has been digitally signed. --]
[-- Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-25  4:50       ` Andrei M. Laptev
  2002-10-25 11:16         ` Ruslan N. Balkin
@ 2002-10-25 18:42         ` Karpov A.
  2002-10-25 21:08           ` Sergey V. Degtyaryov
  1 sibling, 1 reply; 12+ messages in thread
From: Karpov A. @ 2002-10-25 18:42 UTC (permalink / raw)
  To: community

Andrei M. Laptev пишет:

>>KOI8 однако, видимо проблема в том, что не подряд идут.
>>    
>>
>Дык я всегда счтал что грамотно настроенная локаль и должна решать в том 
>числе и проблемы KOI8, с буковками расположенными не подряд. Весь вопрос 
>как это сказать перлу, чтоб при сортировке учитывал установки локали.
>  
>
У меня, например, если скрипт типа
========
#!/usr/bin/perl
use locale;
print lc('яЯяЯ');
=========
то все работает, а вот если внутри навороченного скрипта с кучей всяких 
useов, то уже нет :(
и такие проблемы решаю как ранее сказали - tr/ЁЙЦУ.../ёйцу.../



^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-25 18:42         ` Karpov A.
@ 2002-10-25 21:08           ` Sergey V. Degtyaryov
  2002-10-25 22:00             ` Ruslan N. Balkin
  0 siblings, 1 reply; 12+ messages in thread
From: Sergey V. Degtyaryov @ 2002-10-25 21:08 UTC (permalink / raw)
  To: community

Доброго дня, Karpov. 
25 Октября в 22:42 Вы сказали буквально следующее:

> >>KOI8 однако, видимо проблема в том, что не подряд идут.
> >>
> >Дык я всегда счтал что грамотно настроенная локаль и должна
> >решать в том числе и проблемы KOI8, с буковками расположенными
> >не подряд. Весь вопрос как это сказать перлу, чтоб при
> >сортировке учитывал установки локали.

Да, я сразу не подтвердил, сорри.
[а-я] не соответствует действительности.
Проверил на 3-х ALT.
use locale вовсе не use. А если и use, но не locale.

-- 
Сергей


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-25 21:08           ` Sergey V. Degtyaryov
@ 2002-10-25 22:00             ` Ruslan N. Balkin
  2002-10-25 22:25               ` Sergey V. Degtyaryov
  0 siblings, 1 reply; 12+ messages in thread
From: Ruslan N. Balkin @ 2002-10-25 22:00 UTC (permalink / raw)
  To: community

[-- Attachment #1: Type: text/plain, Size: 1812 bytes --]

On Sat, 26 Oct 2002 01:08:09 +0400
Sergey wrote:

> Доброго дня, Karpov. 
> 25 Октября в 22:42 Вы сказали буквально следующее:
> 
> > >>KOI8 однако, видимо проблема в том, что не подряд идут.
> > >>
> > >Дык я всегда счтал что грамотно настроенная локаль и должна
> > >решать в том числе и проблемы KOI8, с буковками расположенными
> > >не подряд. Весь вопрос как это сказать перлу, чтоб при
> > >сортировке учитывал установки локали.
> 
> Да, я сразу не подтвердил, сорри.
> [а-я] не соответствует действительности.
> Проверил на 3-х ALT.
> use locale вовсе не use. А если и use, но не locale.
Уверен, с KOI8 работать не будет. Непоследовательно идут буквы.
С perldoc.com, faq по regex:
How can I match a locale-smart version of /[a-zA-Z]/?  toc

One alphabetic character would be /[^\W\d_]/, no matter what locale you're
in. Non-alphabetics would be /[\W\d_]/ (assuming you don't consider an
underscore a letter).

И еще в подтверждение моей правоты - из man regex:       
A bracket expression is a list of characters enclosed in `[]'.  It nor-    
mally matches  any single character from the list (but see below).  If   
the list begins with `^', it matches  any  single  character  (but  see 
below)  not  from  the rest of the list.  If two characters in the list
are separated by `-', this is shorthand for the full range  of charac-     
ters  between  those  two  (inclusive)  in the collating sequence, e.g.    
`[0-9]' in ASCII matches any decimal digit.  It is illegal(!)  for two    
ranges  to share an endpoint, e.g. `a-c-e'. Ranges are very collating-   
sequence-dependent, and portable programs should avoid relying on them.

То есть пользуйтесь use locale; и \w, как и положено, или задавайте ранг
так: [абвгдежзийкл] :)
-- 
С уважением,
Балькин Руслан.

[-- Attachment #2: For security, this message has been digitally signed. --]
[-- Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-25 22:00             ` Ruslan N. Balkin
@ 2002-10-25 22:25               ` Sergey V. Degtyaryov
  2002-10-26  1:50                 ` Ruslan N. Balkin
  0 siblings, 1 reply; 12+ messages in thread
From: Sergey V. Degtyaryov @ 2002-10-25 22:25 UTC (permalink / raw)
  To: community

Доброго дня, Ruslan. 
26 Октября в 02:00 Вы сказали буквально следующее:

> То есть пользуйтесь use locale; и \w, как и положено, или
> задавайте ранг так: [абвгдежзийкл] :)

О том и спич.
\w и [а-я] отличаются таки.
И "full range  of characters  between"  [а-я] не включает весь
русский алфавит.

-- 
Rgds, maga, maga@mail.ru


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами?
  2002-10-25 22:25               ` Sergey V. Degtyaryov
@ 2002-10-26  1:50                 ` Ruslan N. Balkin
  0 siblings, 0 replies; 12+ messages in thread
From: Ruslan N. Balkin @ 2002-10-26  1:50 UTC (permalink / raw)
  To: community

[-- Attachment #1: Type: text/plain, Size: 798 bytes --]

On Sat, 26 Oct 2002 02:25:35 +0400
Sergey wrote:

> Доброго дня, Ruslan. 
> 26 Октября в 02:00 Вы сказали буквально следующее:
> 
> > То есть пользуйтесь use locale; и \w, как и положено, или
> > задавайте ранг так: [абвгдежзийкл] :)
> 
> О том и спич.
> \w и [а-я] отличаются таки.
> И "full range  of characters  between"  [а-я] не включает весь
> русский алфавит.
Вроде бы разговор зашел о том, что perl не поддерживает русские буквы.
На самом деле работает, но так, как описано в документации, а не так, как
хочет программист.
И лично у меня ни разу не было проблем, чтобы perl неверно переводил все
буквы в нижний регистр или что-то в этом роде.
А в вашем случае - четко же написано - range of characters. с кода буквы а
по код буквы я.

-- 
С уважением,
Балькин Руслан.

[-- Attachment #2: For security, this message has been digitally signed. --]
[-- Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 12+ messages in thread

end of thread, other threads:[~2002-10-26  1:50 UTC | newest]

Thread overview: 12+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2002-10-23 15:27 [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? Maxim
2002-10-23 15:37 ` Sergey Degtyaryov
2002-10-23 16:36   ` [Comm] Re[2]: " Maxim
2002-10-24  5:20   ` Andrei M. Laptev
2002-10-24 11:11     ` Ruslan N. Balkin
2002-10-25  4:50       ` Andrei M. Laptev
2002-10-25 11:16         ` Ruslan N. Balkin
2002-10-25 18:42         ` Karpov A.
2002-10-25 21:08           ` Sergey V. Degtyaryov
2002-10-25 22:00             ` Ruslan N. Balkin
2002-10-25 22:25               ` Sergey V. Degtyaryov
2002-10-26  1:50                 ` Ruslan N. Balkin

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git