Saratov Linux User Group
 help / color / mirror / Atom feed
* Re: [Sarlug] Распарсить CSV
  @ 2012-12-03  8:02       ` Aleksei Sinitsyn
    0 siblings, 1 reply; 4+ messages in thread
From: Aleksei Sinitsyn @ 2012-12-03  8:02 UTC (permalink / raw)
  To: Saratov Linux User Group Maillist

3 декабря 2012 г., 11:58 пользователь Тарас Перебейносов
<taras.perebeynosov@gmail.com> написал:
>  ЛО-калк - это что такое)?
>

LibreOffice. Откроет как таблицу.

>
> Оказалось он просто в UTF-16
>
> od -c Storage_Utilization_12-03-12.csv | head
> 0000000 377 376   "  \0   A  \0   l  \0   l  \0      \0   s  \0   e  \0
>
> Решается так:
>
> iconv -f utf16 -t utf8 Storage_Utilization_12-03-12.csv >
> Storage_Utilization_12-03-12-1.csv
>
> 2012/12/3 Sergey Mihailov <sergey.mihailov@gmail.com>
>>
>> Дожили :( Ну загрузи его в ЛО-калк ...
>>
>>
>> 3 декабря 2012 г., 11:41 пользователь Dmitry Agafonov
>> <dmitry@agafonov.pp.ru> написал:
>>
>>> Если вдруг имена пользователей на кириллице и там cp-1251 - вполне
>>> реально
>>>
>>>
>>> 3 декабря 2012 г., 11:39 пользователь Тарас Перебейносов
>>> <taras.perebeynosov@gmail.com> написал:
>>>>
>>>> Друзья,
>>>> помогите, плиз, решить несложную задачку по распарсиванию файлика.
>>>>
>>>> Есть файл CSV, полученный с одного интернет-сервиса. Нужно из него
>>>> вытянуть инфу, отсортировать и потом произвести некоторые действия.
>>>>
>>>> Наткнулся сразу на такую фигню:
>>>> $ less Storage_Utilization_12-03-12.csv
>>>> "Storage_Utilization_12-03-12.csv" may be a binary file.  See it anyway?
>>>>
>>>> Это притом что файл под виндой открывается блокнотиком, да и даже tail
>>>> выдает вполне себе текс:
>>>>
>>>> $ tail Storage_Utilization_12-03-12.csv
>>>> User1   124KB
>>>> User2  201KB
>>>> User3 4.52MB
>>>>
>>>> --
>>>> With best regards,
>>>> Taras.
>>>>
>>>>
>>>> _______________________________________________
>>>> Sarlug mailing list
>>>> Sarlug@lists.lug.ru
>>>> https://lists.lug.ru/mailman/listinfo/sarlug
>>>
>>>
>>>
>>>
>>> --
>>> Dmitry Agafonov ~ http://agafonov.pp.ru/
>>>
>>> _______________________________________________
>>> Sarlug mailing list
>>> Sarlug@lists.lug.ru
>>> https://lists.lug.ru/mailman/listinfo/sarlug
>>
>>
>>
>>
>> --
>> mx
>>
>> _______________________________________________
>> Sarlug mailing list
>> Sarlug@lists.lug.ru
>> https://lists.lug.ru/mailman/listinfo/sarlug
>
>
>
>
> --
> With best regards,
> Taras.
>
>
> _______________________________________________
> Sarlug mailing list
> Sarlug@lists.lug.ru
> https://lists.lug.ru/mailman/listinfo/sarlug



-- 
WBR, sinaps.    http://saratov.lug.ru
JID:sinaps@jabber.org   gtalk:a.sinitsin

^ permalink raw reply	[flat|nested] 4+ messages in thread

* Re: [Sarlug] Распарсить CSV
  @ 2012-12-03  8:56             ` Дмитрий Бурмистров
    0 siblings, 1 reply; 4+ messages in thread
From: Дмитрий Бурмистров @ 2012-12-03  8:56 UTC (permalink / raw)
  To: Saratov Linux User Group Maillist

Здравствуйте, Тарас.

Вы писали 3 декабря 2012 г., 12:48:31:

ТП> ОК, кто может помощь с sed?

ТП> Хочу вычленить из строк вида: 
ТП> First Last    17.01MB

ТП> отдельно First Last и отдельно размер. Причем там могут быть еще
ТП> и KB, т.е. это тоже придется учесть.
ТП> Но пока завис на написании RegExp под sed.

ТП> $ echo 'First Last    17.01MB'|sed -e 's/\([a-zA-Z]+ [a-zA-Z]+\) \([0-9]*\)[KMB]/\1:\2/g'
ТП> First Last    17.01MB


Может, проще так?
$echo "First Last    17.01MB" | awk '{print $1,$2,$3}'

-- 
Origin: А по мне, хоть бревна таскать, лишь бы лежа.
-- 
Sincerely,

Dmitry Burmistrov
mailto:burmistrov@nita-farm.ru



^ permalink raw reply	[flat|nested] 4+ messages in thread

* Re: [Sarlug] Распарсить CSV
  @ 2012-12-03  9:37                 ` Aleksei Sinitsyn
    1 sibling, 0 replies; 4+ messages in thread
From: Aleksei Sinitsyn @ 2012-12-03  9:37 UTC (permalink / raw)
  To: Saratov Linux User Group Maillist

3 декабря 2012 г., 13:25 пользователь Тарас Перебейносов
<taras.perebeynosov@gmail.com> написал:
> ОК, а как бы проще перевести 17.01MB (или 17.01KB) в числовую переменную,
> чтобы можно было дальше сравнить, к примеру, для выявления где больше 2MB
>

 Умножить число на единицу, которую предварительно умножить на K или
M, которые  содержат соотв. количество нулей?

>
> 2012/12/3 Дмитрий Бурмистров <demon@nita-farm.ru>
>>
>> Здравствуйте, Тарас.
>>
>> Вы писали 3 декабря 2012 г., 12:48:31:
>>
>> ТП> ОК, кто может помощь с sed?
>>
>> ТП> Хочу вычленить из строк вида:
>> ТП> First Last    17.01MB
>>
>> ТП> отдельно First Last и отдельно размер. Причем там могут быть еще
>> ТП> и KB, т.е. это тоже придется учесть.
>> ТП> Но пока завис на написании RegExp под sed.
>>
>> ТП> $ echo 'First Last    17.01MB'|sed -e 's/\([a-zA-Z]+ [a-zA-Z]+\)
>> \([0-9]*\)[KMB]/\1:\2/g'
>> ТП> First Last    17.01MB
>>
>>
>> Может, проще так?
>> $echo "First Last    17.01MB" | awk '{print $1,$2,$3}'
>>
>> --
>> Origin: А по мне, хоть бревна таскать, лишь бы лежа.
>> --
>> Sincerely,
>>
>> Dmitry Burmistrov
>> mailto:burmistrov@nita-farm.ru
>>
>> _______________________________________________
>> Sarlug mailing list
>> Sarlug@lists.lug.ru
>> https://lists.lug.ru/mailman/listinfo/sarlug
>
>
>
>
> --
> With best regards,
> Taras.
>
>
> _______________________________________________
> Sarlug mailing list
> Sarlug@lists.lug.ru
> https://lists.lug.ru/mailman/listinfo/sarlug



--
WBR, sinaps.    http://saratov.lug.ru
JID:sinaps@jabber.org   gtalk:a.sinitsin

^ permalink raw reply	[flat|nested] 4+ messages in thread

* Re: [Sarlug] Распарсить CSV
  @ 2012-12-10 11:22                     ` Aleksei Sinitsyn
  0 siblings, 0 replies; 4+ messages in thread
From: Aleksei Sinitsyn @ 2012-12-10 11:22 UTC (permalink / raw)
  To: Saratov Linux User Group Maillist

10 декабря 2012 г., 13:04 пользователь Тарас Перебейносов
<taras.perebeynosov@gmail.com> написал:
> 2 нубских вопроса:
> 1) как мне в if сравнивать дробные числа?
> 2) как можно округлить до integer?
>

 Если до этого считать с помощью bc то можно убрать ключ -l . Без него
bc считает целочисленно

> storage=144388915.2; if [ $storage -lt "5242880" ];then echo yes;else echo
> no;fi
> bash: [: 144388915.2: integer expression expected
>
> 2012/12/3 Дмитрий Бурмистров <demon@nita-farm.ru>
>>
>> awk '{print $3}' | sed 's\KB\*1024\' |
>> sed 's\MB\*1024*1024\' | bc -l
>

-- 
WBR, sinaps.    http://saratov.lug.ru
JID:sinaps@jabber.org   gtalk:a.sinitsin

^ permalink raw reply	[flat|nested] 4+ messages in thread

end of thread, other threads:[~2012-12-10 11:22 UTC | newest]

Thread overview: 4+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2012-12-03  8:02       ` [Sarlug] Распарсить CSV Aleksei Sinitsyn
2012-12-03  8:56             ` Дмитрий Бурмистров
2012-12-03  9:37                 ` Aleksei Sinitsyn
2012-12-10 11:22                     ` Aleksei Sinitsyn

Saratov Linux User Group

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/sarlug/0 sarlug/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 sarlug sarlug/ http://lore.altlinux.org/sarlug \
		sarlug@lists.lug.ru sarlug@lug.ru
	public-inbox-index sarlug

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.sarlug


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git