* [Comm] прогу надо на python'е
@ 2002-11-22 7:55 Евгений В. Хорохорин
2002-11-22 8:04 ` Denis S. Filimonov
` (3 more replies)
0 siblings, 4 replies; 9+ messages in thread
From: Евгений В. Хорохорин @ 2002-11-22 7:55 UTC (permalink / raw)
To: AltLinux Community
Приветствую!
Пытаюсь написать программу для анализа детализации разговоров по мобильному телефону.
Строки разговоров имеют такой вид:
01.09.2002 13:11:34 79272272516 1 55 1 4.00 0.00 4.00
01.09.2002 13:39:27 79272909092 S 2 0 0 0.00 0.00 0.00
(разница только в поле, где стоит 'S').
Но проблема в том, что кроме таблицы разговоров есть еще шапка документа. Если шапку вырезать
"руками" и получившийся файл скормить программе - то все замечательно. Но хотелось бы
чтобы программа сама умела распознавать формат строк, и начинать составлять статистику только
для строк заданного формата. Возможно ли это? Как это сделать?
P.S.: Язык програмирования python
Заранее спасибо
--
Best regards, Genix. mailto: genix@sendmail.ru
Registered Linux User #219993 http://saratov.lug.ru
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Comm] прогу надо на python'е
2002-11-22 7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
@ 2002-11-22 8:04 ` Denis S. Filimonov
2002-11-22 8:12 ` Dmitry E. Oboukhov
2002-11-22 8:47 ` Евгений В. Хорохорин
2002-11-22 8:12 ` Sanja Byelkin
` (2 subsequent siblings)
3 siblings, 2 replies; 9+ messages in thread
From: Denis S. Filimonov @ 2002-11-22 8:04 UTC (permalink / raw)
To: community
22 Ноябрь 2002 13:55, Евгений В. Хорохорин написал:
> Приветствую!
>
> Пытаюсь написать программу для анализа детализации разговоров по мобильному
> телефону. Строки разговоров имеют такой вид:
>
> 01.09.2002 13:11:34 79272272516 1 55 1 4.00
> 0.00 4.00 01.09.2002 13:39:27 79272909092 S 2 0 0
> 0.00 0.00 0.00
>
> (разница только в поле, где стоит 'S').
>
> Но проблема в том, что кроме таблицы разговоров есть еще шапка документа.
> Если шапку вырезать "руками" и получившийся файл скормить программе - то
> все замечательно. Но хотелось бы чтобы программа сама умела распознавать
> формат строк, и начинать составлять статистику только для строк заданного
> формата. Возможно ли это? Как это сделать?
>
> P.S.: Язык програмирования python
>
> Заранее спасибо
парсите ручками? используйте регулярные выражения, они для того и существуют
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Comm] прогу надо на python'е
2002-11-22 8:04 ` Denis S. Filimonov
@ 2002-11-22 8:12 ` Dmitry E. Oboukhov
2002-11-22 8:47 ` Евгений В. Хорохорин
1 sibling, 0 replies; 9+ messages in thread
From: Dmitry E. Oboukhov @ 2002-11-22 8:12 UTC (permalink / raw)
To: community
Denis S. Filimonov wrote:
>22 Ноябрь 2002 13:55, Евгений В. Хорохорин написал:
>
>
>>Приветствую!
>>
>>Пытаюсь написать программу для анализа детализации разговоров по мобильному
>>телефону. Строки разговоров имеют такой вид:
>>
>>01.09.2002 13:11:34 79272272516 1 55 1 4.00
>>0.00 4.00 01.09.2002 13:39:27 79272909092 S 2 0 0
>> 0.00 0.00 0.00
>>
>>(разница только в поле, где стоит 'S').
>>
>>Но проблема в том, что кроме таблицы разговоров есть еще шапка документа.
>>Если шапку вырезать "руками" и получившийся файл скормить программе - то
>>все замечательно. Но хотелось бы чтобы программа сама умела распознавать
>>формат строк, и начинать составлять статистику только для строк заданного
>>формата. Возможно ли это? Как это сделать?
>>
>>P.S.: Язык програмирования python
>>
>>Заранее спасибо
>>
>>
>
>парсите ручками? используйте регулярные выражения, они для того и существуют
>
>
>
см описание на модуль re
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Comm] прогу надо на python'е
2002-11-22 8:04 ` Denis S. Filimonov
2002-11-22 8:12 ` Dmitry E. Oboukhov
@ 2002-11-22 8:47 ` Евгений В. Хорохорин
1 sibling, 0 replies; 9+ messages in thread
From: Евгений В. Хорохорин @ 2002-11-22 8:47 UTC (permalink / raw)
To: community
On Fri, 22 Nov 2002 14:04:47 +0600
"Denis S. Filimonov" <den@academ.org> wrote:
> > P.S.: Язык програмирования python
> >
> > Заранее спасибо
>
> парсите ручками? используйте регулярные выражения, они для того и существуют
Пытаюсь освоить. До этого никогда с ними не сталкивался.
--
Best regards, Genix. mailto: genix@sendmail.ru
Registered Linux User #219993 http://saratov.lug.ru
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Comm] прогу надо на python'е
2002-11-22 7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
2002-11-22 8:04 ` Denis S. Filimonov
@ 2002-11-22 8:12 ` Sanja Byelkin
2002-11-22 8:45 ` Евгений В. Хорохорин
2002-11-22 8:16 ` [Comm] " Axel
2002-11-22 15:02 ` [Comm] " Vitaly Lugovsky
3 siblings, 1 reply; 9+ messages in thread
From: Sanja Byelkin @ 2002-11-22 8:12 UTC (permalink / raw)
To: community
Привет!
On Fri, Nov 22, 2002 at 10:55:20AM +0300, Евгений В. Хорохорин wrote:
> Приветствую!
>
> Пытаюсь написать программу для анализа детализации разговоров по мобильному телефону.
> Строки разговоров имеют такой вид:
>
> 01.09.2002 13:11:34 79272272516 1 55 1 4.00 0.00 4.00
> 01.09.2002 13:39:27 79272909092 S 2 0 0 0.00 0.00 0.00
>
> (разница только в поле, где стоит 'S').
>
> Но проблема в том, что кроме таблицы разговоров есть еще шапка документа. Если шапку вырезать
> "руками" и получившийся файл скормить программе - то все замечательно. Но хотелось бы
> чтобы программа сама умела распознавать формат строк, и начинать составлять статистику только
> для строк заданного формата. Возможно ли это? Как это сделать?
>
> P.S.: Язык програмирования python
>
> Заранее спасибо
Вообще есть 2 варианта:
1. Пропускать шапку и ловить ее конец (я думаю последняя строка шапки
фиксирована), после чего переключатся в режим анализа данных попутно
проверяя, что нет конца таблицы (я думаю он тоже не отличается
разнообразием).
2. Проверять строку на соответствие шаблону данный и если соответствует -
обрабатывать (это я так бы делал на perl если надо сделать быстро (там
проверку можно совместить с разбором строки в одном операторе)).
Что проше делать на python или мождет там есть 3й удобный вариант - судить
вам (из нас двоих вы должно быть его знаете, я - нет :)
--
Regards,
Alexander
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Comm] прогу надо на python'е
2002-11-22 8:12 ` Sanja Byelkin
@ 2002-11-22 8:45 ` Евгений В. Хорохорин
0 siblings, 0 replies; 9+ messages in thread
From: Евгений В. Хорохорин @ 2002-11-22 8:45 UTC (permalink / raw)
To: community
On Fri, 22 Nov 2002 10:12:13 +0200
Sanja Byelkin <sanja@mysql.com> wrote:
> > Пытаюсь написать программу для анализа детализации разговоров по
> > мобильному телефону. Строки разговоров имеют такой вид:
> >
> > 01.09.2002 13:11:34 79272272516 1 55 1 4.00
> > 0.00 4.00
> > 01.09.2002 13:39:27 79272909092 S 2 0 0 0.00
> > 0.00 0.00
> >
> > (разница только в поле, где стоит 'S').
> >
> > Но проблема в том, что кроме таблицы разговоров есть еще шапка
> > документа. Если шапку вырезать"руками" и получившийся файл скормить
> > программе - то все замечательно. Но хотелось бы чтобы программа сама
> > умела распознавать формат строк, и начинать составлять статистику
> > только для строк заданного формата. Возможно ли это? Как это сделать?
> >
> > P.S.: Язык програмирования python
> >
> > Заранее спасибо
>
> Вообще есть 2 варианта:
> 1. Пропускать шапку и ловить ее конец (я думаю последняя строка шапки
> фиксирована), после чего переключатся в режим анализа данных попутно
> проверяя, что нет конца таблицы (я думаю он тоже не отличается
> разнообразием).
> 2. Проверять строку на соответствие шаблону данный и если соответствует
> - обрабатывать (это я так бы делал на perl если надо сделать быстро (там
> проверку можно совместить с разбором строки в одном операторе)).
Для данной проблемы п.2 оказывается более универсальным (собсно я и
спрашивал как его реализовать).
Как откликнулись выше re мне в помощь. ;)))
> Что проше делать на python или мождет там есть 3й удобный вариант -
> судить вам (из нас двоих вы должно быть его знаете, я - нет :)
Это моя первая программа на питоне :)
--
Best regards, Genix. mailto: genix@sendmail.ru
Registered Linux User #219993 http://saratov.lug.ru
^ permalink raw reply [flat|nested] 9+ messages in thread
* [Comm] Re: прогу надо на python'е
2002-11-22 7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
2002-11-22 8:04 ` Denis S. Filimonov
2002-11-22 8:12 ` Sanja Byelkin
@ 2002-11-22 8:16 ` Axel
2002-11-22 8:46 ` Евгений В. Хорохорин
2002-11-22 15:02 ` [Comm] " Vitaly Lugovsky
3 siblings, 1 reply; 9+ messages in thread
From: Axel @ 2002-11-22 8:16 UTC (permalink / raw)
To: AltLinux Community
On Fri, Nov 22, 2002 at 10:55:20AM +0300, Евгений В. Хорохорин wrote:
> "руками" и получившийся файл скормить программе - то все замечательно. Но хотелось бы
> чтобы программа сама умела распознавать формат строк, и начинать составлять статистику только
> для строк заданного формата. Возможно ли это? Как это сделать?
>
> P.S.: Язык програмирования python
>
Вопросы по Python лучше задавать в этот список рассылки:
Русскоязычная группа пользователей Python и Zope: http://zope.net.ru
Zopyrus@itconnection.ru
Для данного случая могу порекомендовать почитать описания функций модуля
re - это реализация регулярных выражений в Python. Обрабатывать только те
строки, которые подпадут под заданный шаблон. Или таким же образом
отлавливать строки с шапкой документа и пропускать их.
--
Axel
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Comm] Re: прогу надо на python'е
2002-11-22 8:16 ` [Comm] " Axel
@ 2002-11-22 8:46 ` Евгений В. Хорохорин
0 siblings, 0 replies; 9+ messages in thread
From: Евгений В. Хорохорин @ 2002-11-22 8:46 UTC (permalink / raw)
To: community
On Fri, 22 Nov 2002 11:16:23 +0300
Axel <axel@technoserv.ru> wrote:
> > "руками" и получившийся файл скормить программе - то все замечательно. Но хотелось бы
> > чтобы программа сама умела распознавать формат строк, и начинать составлять статистику только
> > для строк заданного формата. Возможно ли это? Как это сделать?
> >
> > P.S.: Язык програмирования python
>
> Вопросы по Python лучше задавать в этот список рассылки:
>
> Русскоязычная группа пользователей Python и Zope: http://zope.net.ru
> Zopyrus@itconnection.ru
>
>
> Для данного случая могу порекомендовать почитать описания функций модуля
> re - это реализация регулярных выражений в Python. Обрабатывать только те
> строки, которые подпадут под заданный шаблон. Или таким же образом
> отлавливать строки с шапкой документа и пропускать их.
Спасибо аж два раза! ;)
--
Best regards, Genix. mailto: genix@sendmail.ru
Registered Linux User #219993 http://saratov.lug.ru
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Comm] прогу надо на python'е
2002-11-22 7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
` (2 preceding siblings ...)
2002-11-22 8:16 ` [Comm] " Axel
@ 2002-11-22 15:02 ` Vitaly Lugovsky
3 siblings, 0 replies; 9+ messages in thread
From: Vitaly Lugovsky @ 2002-11-22 15:02 UTC (permalink / raw)
To: AltLinux Community
On Fri, 22 Nov 2002, Евгений В. Хорохорин wrote:
> Возможно ли это? Как это сделать?
Простой шаманский метод - по числу слов в строке + по наличию некошерных
символов.
^ permalink raw reply [flat|nested] 9+ messages in thread
end of thread, other threads:[~2002-11-22 15:02 UTC | newest]
Thread overview: 9+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2002-11-22 7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
2002-11-22 8:04 ` Denis S. Filimonov
2002-11-22 8:12 ` Dmitry E. Oboukhov
2002-11-22 8:47 ` Евгений В. Хорохорин
2002-11-22 8:12 ` Sanja Byelkin
2002-11-22 8:45 ` Евгений В. Хорохорин
2002-11-22 8:16 ` [Comm] " Axel
2002-11-22 8:46 ` Евгений В. Хорохорин
2002-11-22 15:02 ` [Comm] " Vitaly Lugovsky
ALT Linux Community general discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
public-inbox-index community
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.community
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git