ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] Подскажите регулярное выражение для обработки лога rails
@ 2009-01-16 11:04 Денис Черносов
  2009-01-16 11:37 ` Денис Черносов
  0 siblings, 1 reply; 2+ messages in thread
From: Денис Черносов @ 2009-01-16 11:04 UTC (permalink / raw)
  To: ALT Linux Community general discussions

Возникла необходимость посчитать посещаемость на rails-ресурсе. Для
этого нужно лог фильтрануть и завести результат в rails-контроллер,
после чего данные можно будет вертеть, как угодно. Проблема в том, что
в этом логе одно событие на разное количество строк размазано и
приходится их группировать... Кроме того, на первом этапе хочется
считать только успешные визиты на определенную часть сайта (определяем
по url). В процессе отладки фильтра дошел до такой команды (пока не
причёсывал - ногами не бейте):

~/myapp/log]$ cat production.log | grep -B 5 -A 1 "200 OK
\[http://www.cfd-fx.ru" | grep "^Processing\|^Completed\|^$" | sed
"s/^.*(for \(.*\)).*$/\1/" | sed "s/.*cfd\-fx\.ru\(.*\)\]/\1/" | sed
"s/\n\(.*at.*\)\n\(\/.*\)\n/\n\1 on \2\n/"

и до такого вида:

81.29.134.168 at 2008-10-24 08:09:24
/

81.29.134.168 at 2008-10-24 08:09:29
/pages/5

81.29.134.168 at 2008-10-24 08:10:10
/pages/2

81.29.134.168 at 2008-10-24 12:03:58
/

81.29.134.168 at 2008-10-24 12:04:06
/pages/5



а хочу получить в одну строку для каждого посещения. Типа так:
81.29.134.168 at 2008-10-24 08:09:24 to /

81.29.134.168 at 2008-10-24 08:09:29 to /pages/5

81.29.134.168 at 2008-10-24 08:10:10 to /pages/2

81.29.134.168 at 2008-10-24 12:03:58 to /

81.29.134.168 at 2008-10-24 12:04:06 to /pages/5

ну и далее, как-то так:
81.29.134.168;2008-10-24;08:09:24;/
81.29.134.168;2008-10-24;08:09:29;/pages/5
81.29.134.168;2008-10-24;08:10:10;/pages/2
81.29.134.168;2008-10-24;12:03:58;/
81.29.134.168;2008-10-24;12:04:06;/pages/5

с последним я и сам смогу справиться, а вот как нормально склеить
строки - уже голову сломал, но так ничего и не придумал... Видимо в
sed нужно как-то буфера и доп. команды использовать, но я пока до
этого не дорос...
Возможно есть какие-то системные утилитки для этих целей?

Хелп!!!

^ permalink raw reply	[flat|nested] 2+ messages in thread

* Re: [Comm] Подскажите регулярное выражение для обработки лога rails
  2009-01-16 11:04 [Comm] Подскажите регулярное выражение для обработки лога rails Денис Черносов
@ 2009-01-16 11:37 ` Денис Черносов
  0 siblings, 0 replies; 2+ messages in thread
From: Денис Черносов @ 2009-01-16 11:37 UTC (permalink / raw)
  To: ALT Linux Community general discussions

Отбой тревоги :) Таки нашлась команда подходящая (спасибо этой ссылке:
http://www.ant0.ru/sed1line.html):

#Если линия начинается с знака "/", то присоединить её к предыдущей
линии и вставить вместо разрыва " to ":
sed -e :a -e '$!N;s/\n\// to \//;ta' -e 'P;D'

Может кому и пригодится...

^ permalink raw reply	[flat|nested] 2+ messages in thread

end of thread, other threads:[~2009-01-16 11:37 UTC | newest]

Thread overview: 2+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2009-01-16 11:04 [Comm] Подскажите регулярное выражение для обработки лога rails Денис Черносов
2009-01-16 11:37 ` Денис Черносов

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git