* [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? @ 2002-10-23 15:27 Maxim 2002-10-23 15:37 ` Sergey Degtyaryov 0 siblings, 1 reply; 12+ messages in thread From: Maxim @ 2002-10-23 15:27 UTC (permalink / raw) To: ALT Linux Mail List пытаюсь искать строку, но ищет только если точно совпадает, а такая вещь как игнорирование регистра не проходит. -- Maxim mailto:max_conf@e-foto.ru 23 октября 2002 г. 19:25 ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-23 15:27 [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? Maxim @ 2002-10-23 15:37 ` Sergey Degtyaryov 2002-10-23 16:36 ` [Comm] Re[2]: " Maxim 2002-10-24 5:20 ` Andrei M. Laptev 0 siblings, 2 replies; 12+ messages in thread From: Sergey Degtyaryov @ 2002-10-23 15:37 UTC (permalink / raw) To: community Доброго дня, Maxim. 23 Октября в 19:27 Вы сказали буквально следующее: > пытаюсь искать строку, но ищет только если точно совпадает, а > такая вещь как игнорирование регистра не проходит. use locale; -- Rgds, maga, maga@mail.ru [maga@localhost]$ /usr/games/fortune Лежит боец, не справился с атакой. ^ permalink raw reply [flat|nested] 12+ messages in thread
* [Comm] Re[2]: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-23 15:37 ` Sergey Degtyaryov @ 2002-10-23 16:36 ` Maxim 2002-10-24 5:20 ` Andrei M. Laptev 1 sibling, 0 replies; 12+ messages in thread From: Maxim @ 2002-10-23 16:36 UTC (permalink / raw) To: Sergey Degtyaryov Здравствуйте, Sergey. простота, сестра таланта! :)) Большущее спасибо! Вы писали 23 октября 2002 г., 19:37:43: SD> Доброго дня, Maxim. SD> 23 Октября в 19:27 Вы сказали буквально следующее: >> пытаюсь искать строку, но ищет только если точно совпадает, а >> такая вещь как игнорирование регистра не проходит. SD> use locale; -- С уважением, Maxim mailto:max_conf@e-foto.ru ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-23 15:37 ` Sergey Degtyaryov 2002-10-23 16:36 ` [Comm] Re[2]: " Maxim @ 2002-10-24 5:20 ` Andrei M. Laptev 2002-10-24 11:11 ` Ruslan N. Balkin 1 sibling, 1 reply; 12+ messages in thread From: Andrei M. Laptev @ 2002-10-24 5:20 UTC (permalink / raw) To: community On Wed, 23 Oct 2002 19:37:43 +0400 Sergey Degtyaryov <maga@replay.ru> wrote: > > пытаюсь искать строку, но ищет только если точно совпадает, а > > такая вещь как игнорирование регистра не проходит. > > use locale; > А я вот тоже недавно столкнулся с похожей проблемой, что нужно как то перлу объяснить что он работает с русскими буквами. вот краткий пример: ----------------8<------------------------- $perl -e 'while (<>){print "--->$_" if /[а-я]/}' а --->а б --->б в г --->г д --->д е --->е ё ж з и --->и й --->й ----------------8<------------------------- То есть буквы в,ё,ж,з ну и там еще несколько не попадают под регулярное выражение [а-я], хотя с англиским аналогом [a-z] проблем нет. Попытки писать use locale или setlocale(LC_ALL,'ru_RU.KOI8-R') у меня эффекта не дали. Для себя решил проблему просто перечислив все русские буквы в квадратных скобках. -- С уважением, Лаптев Андрей ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-24 5:20 ` Andrei M. Laptev @ 2002-10-24 11:11 ` Ruslan N. Balkin 2002-10-25 4:50 ` Andrei M. Laptev 0 siblings, 1 reply; 12+ messages in thread From: Ruslan N. Balkin @ 2002-10-24 11:11 UTC (permalink / raw) To: community [-- Attachment #1: Type: text/plain, Size: 473 bytes --] On Thu, 24 Oct 2002 10:20:29 +0500 Andrei wrote: > То есть буквы в,ё,ж,з ну и там еще несколько не попадают под регулярное > выражение [а-я], хотя с англиским аналогом [a-z] проблем нет. Попытки > писать use locale или setlocale(LC_ALL,'ru_RU.KOI8-R') у меня эффекта не > дали. KOI8 однако, видимо проблема в том, что не подряд идут. > Для себя решил проблему просто перечислив все русские буквы в квадратных > скобках. > -- С уважением, Балькин Руслан. [-- Attachment #2: For security, this message has been digitally signed. --] [-- Type: application/pgp-signature, Size: 189 bytes --] ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-24 11:11 ` Ruslan N. Balkin @ 2002-10-25 4:50 ` Andrei M. Laptev 2002-10-25 11:16 ` Ruslan N. Balkin 2002-10-25 18:42 ` Karpov A. 0 siblings, 2 replies; 12+ messages in thread From: Andrei M. Laptev @ 2002-10-25 4:50 UTC (permalink / raw) To: community On Thu, 24 Oct 2002 15:11:49 +0400 "Ruslan N. Balkin" <baron@dartel.ru> wrote: > KOI8 однако, видимо проблема в том, что не подряд идут. Дык я всегда счтал что грамотно настроенная локаль и должна решать в том числе и проблемы KOI8, с буковками расположенными не подряд. Весь вопрос как это сказать перлу, чтоб при сортировке учитывал установки локали. -- С уважением, Лаптев Андрей ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-25 4:50 ` Andrei M. Laptev @ 2002-10-25 11:16 ` Ruslan N. Balkin 2002-10-25 18:42 ` Karpov A. 1 sibling, 0 replies; 12+ messages in thread From: Ruslan N. Balkin @ 2002-10-25 11:16 UTC (permalink / raw) To: community [-- Attachment #1: Type: text/plain, Size: 544 bytes --] On Fri, 25 Oct 2002 09:50:54 +0500 Andrei wrote: > On Thu, 24 Oct 2002 15:11:49 +0400 > "Ruslan N. Balkin" <baron@dartel.ru> wrote: > > > KOI8 однако, видимо проблема в том, что не подряд идут. > Дык я всегда счтал что грамотно настроенная локаль и должна решать в том > числе и проблемы KOI8, с буковками расположенными не подряд. Весь вопрос > как это сказать перлу, чтоб при сортировке учитывал установки локали. При сортировке: use locale; Если сами пишете - то это Ваши проблемы :) -- С уважением, Балькин Руслан. [-- Attachment #2: For security, this message has been digitally signed. --] [-- Type: application/pgp-signature, Size: 189 bytes --] ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-25 4:50 ` Andrei M. Laptev 2002-10-25 11:16 ` Ruslan N. Balkin @ 2002-10-25 18:42 ` Karpov A. 2002-10-25 21:08 ` Sergey V. Degtyaryov 1 sibling, 1 reply; 12+ messages in thread From: Karpov A. @ 2002-10-25 18:42 UTC (permalink / raw) To: community Andrei M. Laptev пишет: >>KOI8 однако, видимо проблема в том, что не подряд идут. >> >> >Дык я всегда счтал что грамотно настроенная локаль и должна решать в том >числе и проблемы KOI8, с буковками расположенными не подряд. Весь вопрос >как это сказать перлу, чтоб при сортировке учитывал установки локали. > > У меня, например, если скрипт типа ======== #!/usr/bin/perl use locale; print lc('яЯяЯ'); ========= то все работает, а вот если внутри навороченного скрипта с кучей всяких useов, то уже нет :( и такие проблемы решаю как ранее сказали - tr/ЁЙЦУ.../ёйцу.../ ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-25 18:42 ` Karpov A. @ 2002-10-25 21:08 ` Sergey V. Degtyaryov 2002-10-25 22:00 ` Ruslan N. Balkin 0 siblings, 1 reply; 12+ messages in thread From: Sergey V. Degtyaryov @ 2002-10-25 21:08 UTC (permalink / raw) To: community Доброго дня, Karpov. 25 Октября в 22:42 Вы сказали буквально следующее: > >>KOI8 однако, видимо проблема в том, что не подряд идут. > >> > >Дык я всегда счтал что грамотно настроенная локаль и должна > >решать в том числе и проблемы KOI8, с буковками расположенными > >не подряд. Весь вопрос как это сказать перлу, чтоб при > >сортировке учитывал установки локали. Да, я сразу не подтвердил, сорри. [а-я] не соответствует действительности. Проверил на 3-х ALT. use locale вовсе не use. А если и use, но не locale. -- Сергей ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-25 21:08 ` Sergey V. Degtyaryov @ 2002-10-25 22:00 ` Ruslan N. Balkin 2002-10-25 22:25 ` Sergey V. Degtyaryov 0 siblings, 1 reply; 12+ messages in thread From: Ruslan N. Balkin @ 2002-10-25 22:00 UTC (permalink / raw) To: community [-- Attachment #1: Type: text/plain, Size: 1812 bytes --] On Sat, 26 Oct 2002 01:08:09 +0400 Sergey wrote: > Доброго дня, Karpov. > 25 Октября в 22:42 Вы сказали буквально следующее: > > > >>KOI8 однако, видимо проблема в том, что не подряд идут. > > >> > > >Дык я всегда счтал что грамотно настроенная локаль и должна > > >решать в том числе и проблемы KOI8, с буковками расположенными > > >не подряд. Весь вопрос как это сказать перлу, чтоб при > > >сортировке учитывал установки локали. > > Да, я сразу не подтвердил, сорри. > [а-я] не соответствует действительности. > Проверил на 3-х ALT. > use locale вовсе не use. А если и use, но не locale. Уверен, с KOI8 работать не будет. Непоследовательно идут буквы. С perldoc.com, faq по regex: How can I match a locale-smart version of /[a-zA-Z]/? toc One alphabetic character would be /[^\W\d_]/, no matter what locale you're in. Non-alphabetics would be /[\W\d_]/ (assuming you don't consider an underscore a letter). И еще в подтверждение моей правоты - из man regex: A bracket expression is a list of characters enclosed in `[]'. It nor- mally matches any single character from the list (but see below). If the list begins with `^', it matches any single character (but see below) not from the rest of the list. If two characters in the list are separated by `-', this is shorthand for the full range of charac- ters between those two (inclusive) in the collating sequence, e.g. `[0-9]' in ASCII matches any decimal digit. It is illegal(!) for two ranges to share an endpoint, e.g. `a-c-e'. Ranges are very collating- sequence-dependent, and portable programs should avoid relying on them. То есть пользуйтесь use locale; и \w, как и положено, или задавайте ранг так: [абвгдежзийкл] :) -- С уважением, Балькин Руслан. [-- Attachment #2: For security, this message has been digitally signed. --] [-- Type: application/pgp-signature, Size: 189 bytes --] ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-25 22:00 ` Ruslan N. Balkin @ 2002-10-25 22:25 ` Sergey V. Degtyaryov 2002-10-26 1:50 ` Ruslan N. Balkin 0 siblings, 1 reply; 12+ messages in thread From: Sergey V. Degtyaryov @ 2002-10-25 22:25 UTC (permalink / raw) To: community Доброго дня, Ruslan. 26 Октября в 02:00 Вы сказали буквально следующее: > То есть пользуйтесь use locale; и \w, как и положено, или > задавайте ранг так: [абвгдежзийкл] :) О том и спич. \w и [а-я] отличаются таки. И "full range of characters between" [а-я] не включает весь русский алфавит. -- Rgds, maga, maga@mail.ru ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? 2002-10-25 22:25 ` Sergey V. Degtyaryov @ 2002-10-26 1:50 ` Ruslan N. Balkin 0 siblings, 0 replies; 12+ messages in thread From: Ruslan N. Balkin @ 2002-10-26 1:50 UTC (permalink / raw) To: community [-- Attachment #1: Type: text/plain, Size: 798 bytes --] On Sat, 26 Oct 2002 02:25:35 +0400 Sergey wrote: > Доброго дня, Ruslan. > 26 Октября в 02:00 Вы сказали буквально следующее: > > > То есть пользуйтесь use locale; и \w, как и положено, или > > задавайте ранг так: [абвгдежзийкл] :) > > О том и спич. > \w и [а-я] отличаются таки. > И "full range of characters between" [а-я] не включает весь > русский алфавит. Вроде бы разговор зашел о том, что perl не поддерживает русские буквы. На самом деле работает, но так, как описано в документации, а не так, как хочет программист. И лично у меня ни разу не было проблем, чтобы perl неверно переводил все буквы в нижний регистр или что-то в этом роде. А в вашем случае - четко же написано - range of characters. с кода буквы а по код буквы я. -- С уважением, Балькин Руслан. [-- Attachment #2: For security, this message has been digitally signed. --] [-- Type: application/pgp-signature, Size: 189 bytes --] ^ permalink raw reply [flat|nested] 12+ messages in thread
end of thread, other threads:[~2002-10-26 1:50 UTC | newest] Thread overview: 12+ messages (download: mbox.gz / follow: Atom feed) -- links below jump to the message on this page -- 2002-10-23 15:27 [Comm] [JT] а работает ли мастеровский перл, регулярные выражения, с русскими буквами? Maxim 2002-10-23 15:37 ` Sergey Degtyaryov 2002-10-23 16:36 ` [Comm] Re[2]: " Maxim 2002-10-24 5:20 ` Andrei M. Laptev 2002-10-24 11:11 ` Ruslan N. Balkin 2002-10-25 4:50 ` Andrei M. Laptev 2002-10-25 11:16 ` Ruslan N. Balkin 2002-10-25 18:42 ` Karpov A. 2002-10-25 21:08 ` Sergey V. Degtyaryov 2002-10-25 22:00 ` Ruslan N. Balkin 2002-10-25 22:25 ` Sergey V. Degtyaryov 2002-10-26 1:50 ` Ruslan N. Balkin
ALT Linux Community general discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 community community/ http://lore.altlinux.org/community \ mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com public-inbox-index community Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.community AGPL code for this site: git clone https://public-inbox.org/public-inbox.git