* Re: [Sarlug] Распарсить CSV
@ 2012-12-03 8:02 ` Aleksei Sinitsyn
0 siblings, 1 reply; 4+ messages in thread
From: Aleksei Sinitsyn @ 2012-12-03 8:02 UTC (permalink / raw)
To: Saratov Linux User Group Maillist
3 декабря 2012 г., 11:58 пользователь Тарас Перебейносов
<taras.perebeynosov@gmail.com> написал:
> ЛО-калк - это что такое)?
>
LibreOffice. Откроет как таблицу.
>
> Оказалось он просто в UTF-16
>
> od -c Storage_Utilization_12-03-12.csv | head
> 0000000 377 376 " \0 A \0 l \0 l \0 \0 s \0 e \0
>
> Решается так:
>
> iconv -f utf16 -t utf8 Storage_Utilization_12-03-12.csv >
> Storage_Utilization_12-03-12-1.csv
>
> 2012/12/3 Sergey Mihailov <sergey.mihailov@gmail.com>
>>
>> Дожили :( Ну загрузи его в ЛО-калк ...
>>
>>
>> 3 декабря 2012 г., 11:41 пользователь Dmitry Agafonov
>> <dmitry@agafonov.pp.ru> написал:
>>
>>> Если вдруг имена пользователей на кириллице и там cp-1251 - вполне
>>> реально
>>>
>>>
>>> 3 декабря 2012 г., 11:39 пользователь Тарас Перебейносов
>>> <taras.perebeynosov@gmail.com> написал:
>>>>
>>>> Друзья,
>>>> помогите, плиз, решить несложную задачку по распарсиванию файлика.
>>>>
>>>> Есть файл CSV, полученный с одного интернет-сервиса. Нужно из него
>>>> вытянуть инфу, отсортировать и потом произвести некоторые действия.
>>>>
>>>> Наткнулся сразу на такую фигню:
>>>> $ less Storage_Utilization_12-03-12.csv
>>>> "Storage_Utilization_12-03-12.csv" may be a binary file. See it anyway?
>>>>
>>>> Это притом что файл под виндой открывается блокнотиком, да и даже tail
>>>> выдает вполне себе текс:
>>>>
>>>> $ tail Storage_Utilization_12-03-12.csv
>>>> User1 124KB
>>>> User2 201KB
>>>> User3 4.52MB
>>>>
>>>> --
>>>> With best regards,
>>>> Taras.
>>>>
>>>>
>>>> _______________________________________________
>>>> Sarlug mailing list
>>>> Sarlug@lists.lug.ru
>>>> https://lists.lug.ru/mailman/listinfo/sarlug
>>>
>>>
>>>
>>>
>>> --
>>> Dmitry Agafonov ~ http://agafonov.pp.ru/
>>>
>>> _______________________________________________
>>> Sarlug mailing list
>>> Sarlug@lists.lug.ru
>>> https://lists.lug.ru/mailman/listinfo/sarlug
>>
>>
>>
>>
>> --
>> mx
>>
>> _______________________________________________
>> Sarlug mailing list
>> Sarlug@lists.lug.ru
>> https://lists.lug.ru/mailman/listinfo/sarlug
>
>
>
>
> --
> With best regards,
> Taras.
>
>
> _______________________________________________
> Sarlug mailing list
> Sarlug@lists.lug.ru
> https://lists.lug.ru/mailman/listinfo/sarlug
--
WBR, sinaps. http://saratov.lug.ru
JID:sinaps@jabber.org gtalk:a.sinitsin
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Sarlug] Распарсить CSV
@ 2012-12-03 8:56 ` Дмитрий Бурмистров
0 siblings, 1 reply; 4+ messages in thread
From: Дмитрий Бурмистров @ 2012-12-03 8:56 UTC (permalink / raw)
To: Saratov Linux User Group Maillist
Здравствуйте, Тарас.
Вы писали 3 декабря 2012 г., 12:48:31:
ТП> ОК, кто может помощь с sed?
ТП> Хочу вычленить из строк вида:
ТП> First Last 17.01MB
ТП> отдельно First Last и отдельно размер. Причем там могут быть еще
ТП> и KB, т.е. это тоже придется учесть.
ТП> Но пока завис на написании RegExp под sed.
ТП> $ echo 'First Last 17.01MB'|sed -e 's/\([a-zA-Z]+ [a-zA-Z]+\) \([0-9]*\)[KMB]/\1:\2/g'
ТП> First Last 17.01MB
Может, проще так?
$echo "First Last 17.01MB" | awk '{print $1,$2,$3}'
--
Origin: А по мне, хоть бревна таскать, лишь бы лежа.
--
Sincerely,
Dmitry Burmistrov
mailto:burmistrov@nita-farm.ru
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Sarlug] Распарсить CSV
@ 2012-12-03 9:37 ` Aleksei Sinitsyn
1 sibling, 0 replies; 4+ messages in thread
From: Aleksei Sinitsyn @ 2012-12-03 9:37 UTC (permalink / raw)
To: Saratov Linux User Group Maillist
3 декабря 2012 г., 13:25 пользователь Тарас Перебейносов
<taras.perebeynosov@gmail.com> написал:
> ОК, а как бы проще перевести 17.01MB (или 17.01KB) в числовую переменную,
> чтобы можно было дальше сравнить, к примеру, для выявления где больше 2MB
>
Умножить число на единицу, которую предварительно умножить на K или
M, которые содержат соотв. количество нулей?
>
> 2012/12/3 Дмитрий Бурмистров <demon@nita-farm.ru>
>>
>> Здравствуйте, Тарас.
>>
>> Вы писали 3 декабря 2012 г., 12:48:31:
>>
>> ТП> ОК, кто может помощь с sed?
>>
>> ТП> Хочу вычленить из строк вида:
>> ТП> First Last 17.01MB
>>
>> ТП> отдельно First Last и отдельно размер. Причем там могут быть еще
>> ТП> и KB, т.е. это тоже придется учесть.
>> ТП> Но пока завис на написании RegExp под sed.
>>
>> ТП> $ echo 'First Last 17.01MB'|sed -e 's/\([a-zA-Z]+ [a-zA-Z]+\)
>> \([0-9]*\)[KMB]/\1:\2/g'
>> ТП> First Last 17.01MB
>>
>>
>> Может, проще так?
>> $echo "First Last 17.01MB" | awk '{print $1,$2,$3}'
>>
>> --
>> Origin: А по мне, хоть бревна таскать, лишь бы лежа.
>> --
>> Sincerely,
>>
>> Dmitry Burmistrov
>> mailto:burmistrov@nita-farm.ru
>>
>> _______________________________________________
>> Sarlug mailing list
>> Sarlug@lists.lug.ru
>> https://lists.lug.ru/mailman/listinfo/sarlug
>
>
>
>
> --
> With best regards,
> Taras.
>
>
> _______________________________________________
> Sarlug mailing list
> Sarlug@lists.lug.ru
> https://lists.lug.ru/mailman/listinfo/sarlug
--
WBR, sinaps. http://saratov.lug.ru
JID:sinaps@jabber.org gtalk:a.sinitsin
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Sarlug] Распарсить CSV
@ 2012-12-10 11:22 ` Aleksei Sinitsyn
0 siblings, 0 replies; 4+ messages in thread
From: Aleksei Sinitsyn @ 2012-12-10 11:22 UTC (permalink / raw)
To: Saratov Linux User Group Maillist
10 декабря 2012 г., 13:04 пользователь Тарас Перебейносов
<taras.perebeynosov@gmail.com> написал:
> 2 нубских вопроса:
> 1) как мне в if сравнивать дробные числа?
> 2) как можно округлить до integer?
>
Если до этого считать с помощью bc то можно убрать ключ -l . Без него
bc считает целочисленно
> storage=144388915.2; if [ $storage -lt "5242880" ];then echo yes;else echo
> no;fi
> bash: [: 144388915.2: integer expression expected
>
> 2012/12/3 Дмитрий Бурмистров <demon@nita-farm.ru>
>>
>> awk '{print $3}' | sed 's\KB\*1024\' |
>> sed 's\MB\*1024*1024\' | bc -l
>
--
WBR, sinaps. http://saratov.lug.ru
JID:sinaps@jabber.org gtalk:a.sinitsin
^ permalink raw reply [flat|nested] 4+ messages in thread
end of thread, other threads:[~2012-12-10 11:22 UTC | newest]
Thread overview: 4+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2012-12-03 8:02 ` [Sarlug] Распарсить CSV Aleksei Sinitsyn
2012-12-03 8:56 ` Дмитрий Бурмистров
2012-12-03 9:37 ` Aleksei Sinitsyn
2012-12-10 11:22 ` Aleksei Sinitsyn
Saratov Linux User Group
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/sarlug/0 sarlug/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 sarlug sarlug/ http://lore.altlinux.org/sarlug \
sarlug@lists.lug.ru sarlug@lug.ru
public-inbox-index sarlug
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.sarlug
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git