* [Comm] Конверт в AASCII
@ 2011-11-09 13:36 Teimuraz Abashidze
2011-11-09 14:03 ` Yury Aliaev
2011-11-09 15:06 ` Andrew G. Klepcha
0 siblings, 2 replies; 4+ messages in thread
From: Teimuraz Abashidze @ 2011-11-09 13:36 UTC (permalink / raw)
To: ALT Linux Community general discussions
Задача: некий файл нужно привести к 7-битному виду. Система отправки
СМС по имейлу, посылаешь письмо на НОМЕР_МОБИЛЫ@НЕКИЙ_ДОМЕН, там оно
обрабатывается и кладется в мейлбокс. Принимающий сервер - на винде
плюс некая проприетарная ситема российской разработки, читающая почту
с почтового сервака и отправляющая на СМС.
Почтовый сервер - Центос, плюс небольшой шелловский скрипт.
Присылаемый текст должен обрезаться до 160 символов, но так как
отправлен может быть и HTML (что и делает как правило любимый
АутГлюк), его нужно преобразовать в текст (lynx --dump INFILE >
OUTFILE решает дело), при этом текст не должен содержать ничего
"лишнего": кириллических или иных не-латинских символов, управляющих
кодов и т.д., иначе принимающая система (которая получает письмо с
Центоса и непосредственно занимается отправкой) шизеет и её нужно
перегружать. Поменять тупую систему не предлагать, не мы делали...
В общем: как убрать из текст ВСЁ, кроме латинских символов, цифр и
всяких @#%^^&*()?
Желательно средствами баш/sed и т.д., допускаются перл и/или питон.
Заранее спасибо.
--
Best regards,
Teimuraz Abashidze
--------------------------------------------
Linux user #140208
---Visit my home page:
http://www.facebook.com/teimuraz.abashidze - FaceBook
http://forum.tbilicity.com - Тбилисский форум
http://raindi.ge/taichi - Тайцзицзюань в Тбилиси
http://picasaweb.google.com/tgasoft/ - Мои фото
http://teimuraz1962.livejournal.com - Я в ЖЖ
kalia1962 - Skype
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Comm] Конверт в AASCII
2011-11-09 13:36 [Comm] Конверт в AASCII Teimuraz Abashidze
@ 2011-11-09 14:03 ` Yury Aliaev
2011-11-09 14:21 ` Teimuraz Abashidze
2011-11-09 15:06 ` Andrew G. Klepcha
1 sibling, 1 reply; 4+ messages in thread
From: Yury Aliaev @ 2011-11-09 14:03 UTC (permalink / raw)
To: ALT Linux Community general discussions
On 11/09/2011 07:36 AM, Teimuraz Abashidze wrote:
>
> В общем: как убрать из текст ВСЁ, кроме латинских символов, цифр и
> всяких @#%^^&*()?
> Желательно средствами баш/sed и т.д., допускаются перл и/или питон.
>
По-моему, на Перле всё элементарно, читаем посимвольно из stdin, если
встречаем код >127, то пропускаем, иначе пишем в stdout. Если была бы
известна кодировка исходных сообщений, то несложно и транслитерацию
прикрутить :) Кстати, lynx вроде умеет сам транслит делать, вот и решение :)
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Comm] Конверт в AASCII
2011-11-09 14:03 ` Yury Aliaev
@ 2011-11-09 14:21 ` Teimuraz Abashidze
0 siblings, 0 replies; 4+ messages in thread
From: Teimuraz Abashidze @ 2011-11-09 14:21 UTC (permalink / raw)
To: ALT Linux Community general discussions
2011/11/9 Yury Aliaev:
> On 11/09/2011 07:36 AM, Teimuraz Abashidze wrote:
>
>>
>> В общем: как убрать из текст ВСЁ, кроме латинских символов, цифр и
>> всяких @#%^^&*()?
>> Желательно средствами баш/sed и т.д., допускаются перл и/или питон.
>>
>
> По-моему, на Перле всё элементарно, читаем посимвольно из stdin, если
> встречаем код >127, то пропускаем, иначе пишем в stdout. Если была бы
> известна кодировка исходных сообщений, то несложно и транслитерацию
> прикрутить :) Кстати, lynx вроде умеет сам транслит делать, вот и решение :)
Боюсь, что это будет крайне медленно... К тому же кодировка исходно
мейла может быть какой угодно.
Я уже решил эту задачку, оказывается, все не просто, а ОЧЕНЬ просто!
cat filename|tr -cd '\11\12\15\40-\176' - и все.
Всем спасибо, тема закрыта.
--
Best regards,
Teimuraz Abashidze
--------------------------------------------
Linux user #140208
---Visit my home page:
http://www.facebook.com/teimuraz.abashidze - FaceBook
http://forum.tbilicity.com - Тбилисский форум
http://raindi.ge/taichi - Тайцзицзюань в Тбилиси
http://picasaweb.google.com/tgasoft/ - Мои фото
http://teimuraz1962.livejournal.com - Я в ЖЖ
kalia1962 - Skype
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Comm] Конверт в AASCII
2011-11-09 13:36 [Comm] Конверт в AASCII Teimuraz Abashidze
2011-11-09 14:03 ` Yury Aliaev
@ 2011-11-09 15:06 ` Andrew G. Klepcha
1 sibling, 0 replies; 4+ messages in thread
From: Andrew G. Klepcha @ 2011-11-09 15:06 UTC (permalink / raw)
To: ALT Linux Community general discussions
В сообщении от 9 ноября 2011 15:36:16 автор Teimuraz Abashidze написал:
> Задача: некий файл нужно привести к 7-битному виду. Система отправки
> СМС по имейлу, посылаешь письмо на НОМЕР_МОБИЛЫ@НЕКИЙ_ДОМЕН, там оно
> обрабатывается и кладется в мейлбокс. Принимающий сервер - на винде
> плюс некая проприетарная ситема российской разработки, читающая почту
> с почтового сервака и отправляющая на СМС.
>
> Почтовый сервер - Центос, плюс небольшой шелловский скрипт.
>
> Присылаемый текст должен обрезаться до 160 символов, но так как
> отправлен может быть и HTML (что и делает как правило любимый
> АутГлюк), его нужно преобразовать в текст (lynx --dump INFILE >
> OUTFILE решает дело), при этом текст не должен содержать ничего
> "лишнего": кириллических или иных не-латинских символов, управляющих
> кодов и т.д., иначе принимающая система (которая получает письмо с
> Центоса и непосредственно занимается отправкой) шизеет и её нужно
> перегружать. Поменять тупую систему не предлагать, не мы делали...
>
> В общем: как убрать из текст ВСЁ, кроме латинских символов, цифр и
> всяких @#%^^&*()?
> Желательно средствами баш/sed и т.д., допускаются перл и/или питон.
>
> Заранее спасибо.
а strings не прокатит?
^ permalink raw reply [flat|nested] 4+ messages in thread
end of thread, other threads:[~2011-11-09 15:06 UTC | newest]
Thread overview: 4+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2011-11-09 13:36 [Comm] Конверт в AASCII Teimuraz Abashidze
2011-11-09 14:03 ` Yury Aliaev
2011-11-09 14:21 ` Teimuraz Abashidze
2011-11-09 15:06 ` Andrew G. Klepcha
ALT Linux Community general discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
public-inbox-index community
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.community
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git