* Re: [Sarlug] Распарсить CSV @ 2012-12-03 8:02 ` Aleksei Sinitsyn 0 siblings, 1 reply; 4+ messages in thread From: Aleksei Sinitsyn @ 2012-12-03 8:02 UTC (permalink / raw) To: Saratov Linux User Group Maillist 3 декабря 2012 г., 11:58 пользователь Тарас Перебейносов <taras.perebeynosov@gmail.com> написал: > ЛО-калк - это что такое)? > LibreOffice. Откроет как таблицу. > > Оказалось он просто в UTF-16 > > od -c Storage_Utilization_12-03-12.csv | head > 0000000 377 376 " \0 A \0 l \0 l \0 \0 s \0 e \0 > > Решается так: > > iconv -f utf16 -t utf8 Storage_Utilization_12-03-12.csv > > Storage_Utilization_12-03-12-1.csv > > 2012/12/3 Sergey Mihailov <sergey.mihailov@gmail.com> >> >> Дожили :( Ну загрузи его в ЛО-калк ... >> >> >> 3 декабря 2012 г., 11:41 пользователь Dmitry Agafonov >> <dmitry@agafonov.pp.ru> написал: >> >>> Если вдруг имена пользователей на кириллице и там cp-1251 - вполне >>> реально >>> >>> >>> 3 декабря 2012 г., 11:39 пользователь Тарас Перебейносов >>> <taras.perebeynosov@gmail.com> написал: >>>> >>>> Друзья, >>>> помогите, плиз, решить несложную задачку по распарсиванию файлика. >>>> >>>> Есть файл CSV, полученный с одного интернет-сервиса. Нужно из него >>>> вытянуть инфу, отсортировать и потом произвести некоторые действия. >>>> >>>> Наткнулся сразу на такую фигню: >>>> $ less Storage_Utilization_12-03-12.csv >>>> "Storage_Utilization_12-03-12.csv" may be a binary file. See it anyway? >>>> >>>> Это притом что файл под виндой открывается блокнотиком, да и даже tail >>>> выдает вполне себе текс: >>>> >>>> $ tail Storage_Utilization_12-03-12.csv >>>> User1 124KB >>>> User2 201KB >>>> User3 4.52MB >>>> >>>> -- >>>> With best regards, >>>> Taras. >>>> >>>> >>>> _______________________________________________ >>>> Sarlug mailing list >>>> Sarlug@lists.lug.ru >>>> https://lists.lug.ru/mailman/listinfo/sarlug >>> >>> >>> >>> >>> -- >>> Dmitry Agafonov ~ http://agafonov.pp.ru/ >>> >>> _______________________________________________ >>> Sarlug mailing list >>> Sarlug@lists.lug.ru >>> https://lists.lug.ru/mailman/listinfo/sarlug >> >> >> >> >> -- >> mx >> >> _______________________________________________ >> Sarlug mailing list >> Sarlug@lists.lug.ru >> https://lists.lug.ru/mailman/listinfo/sarlug > > > > > -- > With best regards, > Taras. > > > _______________________________________________ > Sarlug mailing list > Sarlug@lists.lug.ru > https://lists.lug.ru/mailman/listinfo/sarlug -- WBR, sinaps. http://saratov.lug.ru JID:sinaps@jabber.org gtalk:a.sinitsin ^ permalink raw reply [flat|nested] 4+ messages in thread
[parent not found: <CANXqFx-cp5=fsqcQZ91cuMFqckUO5YWtryZPVp_T1Pgwg4xpEA@mail.gmail.com>]
[parent not found: <CANXqFx_hH=VFmsW=WEyt4a_PwKYBoyK8=QtBMPiXiO-JZ9xraA@mail.gmail.com>]
* Re: [Sarlug] Распарсить CSV @ 2012-12-03 8:56 ` Дмитрий Бурмистров 0 siblings, 1 reply; 4+ messages in thread From: Дмитрий Бурмистров @ 2012-12-03 8:56 UTC (permalink / raw) To: Saratov Linux User Group Maillist Здравствуйте, Тарас. Вы писали 3 декабря 2012 г., 12:48:31: ТП> ОК, кто может помощь с sed? ТП> Хочу вычленить из строк вида: ТП> First Last 17.01MB ТП> отдельно First Last и отдельно размер. Причем там могут быть еще ТП> и KB, т.е. это тоже придется учесть. ТП> Но пока завис на написании RegExp под sed. ТП> $ echo 'First Last 17.01MB'|sed -e 's/\([a-zA-Z]+ [a-zA-Z]+\) \([0-9]*\)[KMB]/\1:\2/g' ТП> First Last 17.01MB Может, проще так? $echo "First Last 17.01MB" | awk '{print $1,$2,$3}' -- Origin: А по мне, хоть бревна таскать, лишь бы лежа. -- Sincerely, Dmitry Burmistrov mailto:burmistrov@nita-farm.ru ^ permalink raw reply [flat|nested] 4+ messages in thread
[parent not found: <CANXqFx-TLebciMeG-QdOcM_9tvCuy3E5BtPK7XMNwBAzyVsJQQ@mail.gmail.com>]
* Re: [Sarlug] Распарсить CSV @ 2012-12-03 9:37 ` Aleksei Sinitsyn 1 sibling, 0 replies; 4+ messages in thread From: Aleksei Sinitsyn @ 2012-12-03 9:37 UTC (permalink / raw) To: Saratov Linux User Group Maillist 3 декабря 2012 г., 13:25 пользователь Тарас Перебейносов <taras.perebeynosov@gmail.com> написал: > ОК, а как бы проще перевести 17.01MB (или 17.01KB) в числовую переменную, > чтобы можно было дальше сравнить, к примеру, для выявления где больше 2MB > Умножить число на единицу, которую предварительно умножить на K или M, которые содержат соотв. количество нулей? > > 2012/12/3 Дмитрий Бурмистров <demon@nita-farm.ru> >> >> Здравствуйте, Тарас. >> >> Вы писали 3 декабря 2012 г., 12:48:31: >> >> ТП> ОК, кто может помощь с sed? >> >> ТП> Хочу вычленить из строк вида: >> ТП> First Last 17.01MB >> >> ТП> отдельно First Last и отдельно размер. Причем там могут быть еще >> ТП> и KB, т.е. это тоже придется учесть. >> ТП> Но пока завис на написании RegExp под sed. >> >> ТП> $ echo 'First Last 17.01MB'|sed -e 's/\([a-zA-Z]+ [a-zA-Z]+\) >> \([0-9]*\)[KMB]/\1:\2/g' >> ТП> First Last 17.01MB >> >> >> Может, проще так? >> $echo "First Last 17.01MB" | awk '{print $1,$2,$3}' >> >> -- >> Origin: А по мне, хоть бревна таскать, лишь бы лежа. >> -- >> Sincerely, >> >> Dmitry Burmistrov >> mailto:burmistrov@nita-farm.ru >> >> _______________________________________________ >> Sarlug mailing list >> Sarlug@lists.lug.ru >> https://lists.lug.ru/mailman/listinfo/sarlug > > > > > -- > With best regards, > Taras. > > > _______________________________________________ > Sarlug mailing list > Sarlug@lists.lug.ru > https://lists.lug.ru/mailman/listinfo/sarlug -- WBR, sinaps. http://saratov.lug.ru JID:sinaps@jabber.org gtalk:a.sinitsin ^ permalink raw reply [flat|nested] 4+ messages in thread
[parent not found: <1389412137.20121203141056@nita-farm.ru>]
[parent not found: <CANXqFx_UP5ZUR-9sd+_N+JpnC3ASiDMzLXF7_u9G_Mp6aS_L8Q@mail.gmail.com>]
* Re: [Sarlug] Распарсить CSV @ 2012-12-10 11:22 ` Aleksei Sinitsyn 0 siblings, 0 replies; 4+ messages in thread From: Aleksei Sinitsyn @ 2012-12-10 11:22 UTC (permalink / raw) To: Saratov Linux User Group Maillist 10 декабря 2012 г., 13:04 пользователь Тарас Перебейносов <taras.perebeynosov@gmail.com> написал: > 2 нубских вопроса: > 1) как мне в if сравнивать дробные числа? > 2) как можно округлить до integer? > Если до этого считать с помощью bc то можно убрать ключ -l . Без него bc считает целочисленно > storage=144388915.2; if [ $storage -lt "5242880" ];then echo yes;else echo > no;fi > bash: [: 144388915.2: integer expression expected > > 2012/12/3 Дмитрий Бурмистров <demon@nita-farm.ru> >> >> awk '{print $3}' | sed 's\KB\*1024\' | >> sed 's\MB\*1024*1024\' | bc -l > -- WBR, sinaps. http://saratov.lug.ru JID:sinaps@jabber.org gtalk:a.sinitsin ^ permalink raw reply [flat|nested] 4+ messages in thread
end of thread, other threads:[~2012-12-10 11:22 UTC | newest] Thread overview: 4+ messages (download: mbox.gz / follow: Atom feed) -- links below jump to the message on this page -- 2012-12-03 8:02 ` [Sarlug] Распарсить CSV Aleksei Sinitsyn 2012-12-03 8:56 ` Дмитрий Бурмистров 2012-12-03 9:37 ` Aleksei Sinitsyn 2012-12-10 11:22 ` Aleksei Sinitsyn
Saratov Linux User Group This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/sarlug/0 sarlug/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 sarlug sarlug/ http://lore.altlinux.org/sarlug \ sarlug@lists.lug.ru sarlug@lug.ru public-inbox-index sarlug Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.sarlug AGPL code for this site: git clone https://public-inbox.org/public-inbox.git