ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] прогу надо на python'е
@ 2002-11-22  7:55 Евгений В. Хорохорин
  2002-11-22  8:04 ` Denis S. Filimonov
                   ` (3 more replies)
  0 siblings, 4 replies; 9+ messages in thread
From: Евгений В. Хорохорин @ 2002-11-22  7:55 UTC (permalink / raw)
  To: AltLinux Community

Приветствую!

Пытаюсь написать программу для анализа детализации разговоров по мобильному телефону.
Строки разговоров имеют такой вид:

01.09.2002 13:11:34  79272272516         1     55        1       4.00     0.00        4.00
01.09.2002 13:39:27  79272909092    S    2      0        0       0.00     0.00        0.00

(разница только в поле, где стоит 'S').

Но проблема в том, что кроме таблицы разговоров есть еще шапка документа. Если шапку вырезать
"руками" и получившийся файл скормить программе - то все замечательно. Но хотелось бы
чтобы программа сама умела распознавать формат строк, и начинать составлять статистику только
для строк заданного формата. Возможно ли это? Как это сделать? 

P.S.: Язык програмирования python

Заранее спасибо

-- 
Best regards, Genix.			mailto: genix@sendmail.ru
Registered Linux User #219993		http://saratov.lug.ru 			


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Comm] прогу надо на python'е
  2002-11-22  7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
@ 2002-11-22  8:04 ` Denis S. Filimonov
  2002-11-22  8:12   ` Dmitry E. Oboukhov
  2002-11-22  8:47   ` Евгений В. Хорохорин
  2002-11-22  8:12 ` Sanja Byelkin
                   ` (2 subsequent siblings)
  3 siblings, 2 replies; 9+ messages in thread
From: Denis S. Filimonov @ 2002-11-22  8:04 UTC (permalink / raw)
  To: community

22 Ноябрь 2002 13:55, Евгений В. Хорохорин написал:
> Приветствую!
>
> Пытаюсь написать программу для анализа детализации разговоров по мобильному
> телефону. Строки разговоров имеют такой вид:
>
> 01.09.2002 13:11:34  79272272516         1     55        1       4.00    
> 0.00        4.00 01.09.2002 13:39:27  79272909092    S    2      0        0
>       0.00     0.00        0.00
>
> (разница только в поле, где стоит 'S').
>
> Но проблема в том, что кроме таблицы разговоров есть еще шапка документа.
> Если шапку вырезать "руками" и получившийся файл скормить программе - то
> все замечательно. Но хотелось бы чтобы программа сама умела распознавать
> формат строк, и начинать составлять статистику только для строк заданного
> формата. Возможно ли это? Как это сделать?
>
> P.S.: Язык програмирования python
>
> Заранее спасибо

парсите ручками? используйте регулярные выражения, они для того и существуют



^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Comm] прогу надо на python'е
  2002-11-22  7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
  2002-11-22  8:04 ` Denis S. Filimonov
@ 2002-11-22  8:12 ` Sanja Byelkin
  2002-11-22  8:45   ` Евгений В. Хорохорин
  2002-11-22  8:16 ` [Comm] " Axel
  2002-11-22 15:02 ` [Comm] " Vitaly Lugovsky
  3 siblings, 1 reply; 9+ messages in thread
From: Sanja Byelkin @ 2002-11-22  8:12 UTC (permalink / raw)
  To: community

Привет!

On Fri, Nov 22, 2002 at 10:55:20AM +0300, Евгений В. Хорохорин wrote:
> Приветствую!
> 
> Пытаюсь написать программу для анализа детализации разговоров по мобильному телефону.
> Строки разговоров имеют такой вид:
> 
> 01.09.2002 13:11:34  79272272516         1     55        1       4.00     0.00        4.00
> 01.09.2002 13:39:27  79272909092    S    2      0        0       0.00     0.00        0.00
> 
> (разница только в поле, где стоит 'S').
> 
> Но проблема в том, что кроме таблицы разговоров есть еще шапка документа. Если шапку вырезать
> "руками" и получившийся файл скормить программе - то все замечательно. Но хотелось бы
> чтобы программа сама умела распознавать формат строк, и начинать составлять статистику только
> для строк заданного формата. Возможно ли это? Как это сделать? 
> 
> P.S.: Язык програмирования python
> 
> Заранее спасибо

Вообще есть 2 варианта:
1. Пропускать шапку и ловить ее конец (я думаю последняя строка шапки
фиксирована), после чего переключатся в режим анализа данных попутно 
проверяя, что нет конца таблицы (я думаю он тоже не отличается
разнообразием).
2. Проверять строку на соответствие шаблону данный и если соответствует -
обрабатывать (это я так бы делал на perl если надо сделать быстро (там
проверку можно совместить с разбором строки в одном операторе)).

Что проше делать на python или мождет там есть 3й удобный вариант - судить
вам (из нас двоих вы должно быть его знаете, я - нет :)

-- 
Regards,
Alexander


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Comm] прогу надо на python'е
  2002-11-22  8:04 ` Denis S. Filimonov
@ 2002-11-22  8:12   ` Dmitry E. Oboukhov
  2002-11-22  8:47   ` Евгений В. Хорохорин
  1 sibling, 0 replies; 9+ messages in thread
From: Dmitry E. Oboukhov @ 2002-11-22  8:12 UTC (permalink / raw)
  To: community

Denis S. Filimonov wrote:

>22 Ноябрь 2002 13:55, Евгений В. Хорохорин написал:
>  
>
>>Приветствую!
>>
>>Пытаюсь написать программу для анализа детализации разговоров по мобильному
>>телефону. Строки разговоров имеют такой вид:
>>
>>01.09.2002 13:11:34  79272272516         1     55        1       4.00    
>>0.00        4.00 01.09.2002 13:39:27  79272909092    S    2      0        0
>>      0.00     0.00        0.00
>>
>>(разница только в поле, где стоит 'S').
>>
>>Но проблема в том, что кроме таблицы разговоров есть еще шапка документа.
>>Если шапку вырезать "руками" и получившийся файл скормить программе - то
>>все замечательно. Но хотелось бы чтобы программа сама умела распознавать
>>формат строк, и начинать составлять статистику только для строк заданного
>>формата. Возможно ли это? Как это сделать?
>>
>>P.S.: Язык програмирования python
>>
>>Заранее спасибо
>>    
>>
>
>парсите ручками? используйте регулярные выражения, они для того и существуют
>
>  
>
см описание на модуль re




^ permalink raw reply	[flat|nested] 9+ messages in thread

* [Comm] Re: прогу надо на python'е
  2002-11-22  7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
  2002-11-22  8:04 ` Denis S. Filimonov
  2002-11-22  8:12 ` Sanja Byelkin
@ 2002-11-22  8:16 ` Axel
  2002-11-22  8:46   ` Евгений В. Хорохорин
  2002-11-22 15:02 ` [Comm] " Vitaly Lugovsky
  3 siblings, 1 reply; 9+ messages in thread
From: Axel @ 2002-11-22  8:16 UTC (permalink / raw)
  To: AltLinux Community

On Fri, Nov 22, 2002 at 10:55:20AM +0300, Евгений В. Хорохорин wrote:

> "руками" и получившийся файл скормить программе - то все замечательно. Но хотелось бы
> чтобы программа сама умела распознавать формат строк, и начинать составлять статистику только
> для строк заданного формата. Возможно ли это? Как это сделать? 
> 
> P.S.: Язык програмирования python
>

Вопросы по Python лучше задавать в этот список рассылки:

Русскоязычная группа пользователей Python и Zope: http://zope.net.ru
Zopyrus@itconnection.ru


Для данного случая могу порекомендовать почитать описания функций модуля
re - это реализация регулярных выражений в Python. Обрабатывать только те
строки, которые подпадут под заданный шаблон. Или таким же образом
отлавливать строки с шапкой документа и пропускать их.

--
Axel




^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Comm] прогу надо на python'е
  2002-11-22  8:12 ` Sanja Byelkin
@ 2002-11-22  8:45   ` Евгений В. Хорохорин
  0 siblings, 0 replies; 9+ messages in thread
From: Евгений В. Хорохорин @ 2002-11-22  8:45 UTC (permalink / raw)
  To: community

On Fri, 22 Nov 2002 10:12:13 +0200
Sanja Byelkin <sanja@mysql.com> wrote:

> > Пытаюсь написать программу для анализа детализации разговоров по
> > мобильному телефону. Строки разговоров имеют такой вид:
> > 
> > 01.09.2002 13:11:34  79272272516         1     55        1       4.00 
> >    0.00        4.00
> > 01.09.2002 13:39:27  79272909092    S    2      0        0       0.00 
> >    0.00        0.00
> > 
> > (разница только в поле, где стоит 'S').
> > 
> > Но проблема в том, что кроме таблицы разговоров есть еще шапка
> > документа. Если шапку вырезать"руками" и получившийся файл скормить
> > программе - то все замечательно. Но хотелось бы чтобы программа сама
> > умела распознавать формат строк, и начинать составлять статистику
> > только для строк заданного формата. Возможно ли это? Как это сделать? 
> > 
> > P.S.: Язык програмирования python
> > 
> > Заранее спасибо
> 
> Вообще есть 2 варианта:
> 1. Пропускать шапку и ловить ее конец (я думаю последняя строка шапки
> фиксирована), после чего переключатся в режим анализа данных попутно 
> проверяя, что нет конца таблицы (я думаю он тоже не отличается
> разнообразием).
> 2. Проверять строку на соответствие шаблону данный и если соответствует
> - обрабатывать (это я так бы делал на perl если надо сделать быстро (там
> проверку можно совместить с разбором строки в одном операторе)).
Для данной проблемы п.2 оказывается более универсальным (собсно я и
спрашивал как его реализовать).
Как откликнулись выше re мне в помощь. ;)))

> Что проше делать на python или мождет там есть 3й удобный вариант -
> судить вам (из нас двоих вы должно быть его знаете, я - нет :)
Это моя первая программа на питоне :)

-- 
Best regards, Genix.			mailto: genix@sendmail.ru
Registered Linux User #219993		http://saratov.lug.ru 			


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Comm] Re: прогу надо на python'е
  2002-11-22  8:16 ` [Comm] " Axel
@ 2002-11-22  8:46   ` Евгений В. Хорохорин
  0 siblings, 0 replies; 9+ messages in thread
From: Евгений В. Хорохорин @ 2002-11-22  8:46 UTC (permalink / raw)
  To: community

On Fri, 22 Nov 2002 11:16:23 +0300
Axel <axel@technoserv.ru> wrote:

> > "руками" и получившийся файл скормить программе - то все замечательно. Но хотелось бы
> > чтобы программа сама умела распознавать формат строк, и начинать составлять статистику только
> > для строк заданного формата. Возможно ли это? Как это сделать? 
> > 
> > P.S.: Язык програмирования python
> 
> Вопросы по Python лучше задавать в этот список рассылки:
> 
> Русскоязычная группа пользователей Python и Zope: http://zope.net.ru
> Zopyrus@itconnection.ru
> 
> 
> Для данного случая могу порекомендовать почитать описания функций модуля
> re - это реализация регулярных выражений в Python. Обрабатывать только те
> строки, которые подпадут под заданный шаблон. Или таким же образом
> отлавливать строки с шапкой документа и пропускать их.

Спасибо аж два раза! ;)

-- 
Best regards, Genix.			mailto: genix@sendmail.ru
Registered Linux User #219993		http://saratov.lug.ru 			


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Comm] прогу надо на python'е
  2002-11-22  8:04 ` Denis S. Filimonov
  2002-11-22  8:12   ` Dmitry E. Oboukhov
@ 2002-11-22  8:47   ` Евгений В. Хорохорин
  1 sibling, 0 replies; 9+ messages in thread
From: Евгений В. Хорохорин @ 2002-11-22  8:47 UTC (permalink / raw)
  To: community

On Fri, 22 Nov 2002 14:04:47 +0600
"Denis S. Filimonov" <den@academ.org> wrote:

> > P.S.: Язык програмирования python
> >
> > Заранее спасибо
> 
> парсите ручками? используйте регулярные выражения, они для того и существуют

Пытаюсь освоить. До этого никогда с ними не сталкивался.

-- 
Best regards, Genix.			mailto: genix@sendmail.ru
Registered Linux User #219993		http://saratov.lug.ru 			


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Comm] прогу надо на python'е
  2002-11-22  7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
                   ` (2 preceding siblings ...)
  2002-11-22  8:16 ` [Comm] " Axel
@ 2002-11-22 15:02 ` Vitaly Lugovsky
  3 siblings, 0 replies; 9+ messages in thread
From: Vitaly Lugovsky @ 2002-11-22 15:02 UTC (permalink / raw)
  To: AltLinux Community

On Fri, 22 Nov 2002, Евгений В. Хорохорин wrote:

> Возможно ли это? Как это сделать? 

 Простой шаманский метод - по числу слов в строке + по наличию некошерных
символов.




^ permalink raw reply	[flat|nested] 9+ messages in thread

end of thread, other threads:[~2002-11-22 15:02 UTC | newest]

Thread overview: 9+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2002-11-22  7:55 [Comm] прогу надо на python'е Евгений В. Хорохорин
2002-11-22  8:04 ` Denis S. Filimonov
2002-11-22  8:12   ` Dmitry E. Oboukhov
2002-11-22  8:47   ` Евгений В. Хорохорин
2002-11-22  8:12 ` Sanja Byelkin
2002-11-22  8:45   ` Евгений В. Хорохорин
2002-11-22  8:16 ` [Comm] " Axel
2002-11-22  8:46   ` Евгений В. Хорохорин
2002-11-22 15:02 ` [Comm] " Vitaly Lugovsky

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git