ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] Конверт в AASCII
@ 2011-11-09 13:36 Teimuraz Abashidze
  2011-11-09 14:03 ` Yury Aliaev
  2011-11-09 15:06 ` Andrew G. Klepcha
  0 siblings, 2 replies; 4+ messages in thread
From: Teimuraz Abashidze @ 2011-11-09 13:36 UTC (permalink / raw)
  To: ALT Linux Community general discussions

Задача: некий файл нужно привести к 7-битному виду. Система отправки
СМС по имейлу, посылаешь письмо на НОМЕР_МОБИЛЫ@НЕКИЙ_ДОМЕН, там оно
обрабатывается и кладется в мейлбокс. Принимающий сервер - на винде
плюс некая проприетарная ситема российской разработки, читающая почту
с почтового сервака и отправляющая на СМС.

Почтовый сервер - Центос, плюс небольшой шелловский скрипт.

Присылаемый текст должен обрезаться до 160 символов, но так как
отправлен может быть и HTML (что и делает как правило любимый
АутГлюк), его нужно преобразовать в текст (lynx --dump INFILE >
OUTFILE решает дело), при этом текст не должен содержать ничего
"лишнего": кириллических или иных не-латинских символов, управляющих
кодов и т.д., иначе принимающая система (которая получает письмо с
Центоса и непосредственно занимается отправкой) шизеет и её нужно
перегружать. Поменять тупую систему не предлагать, не мы делали...

В общем: как убрать из текст ВСЁ, кроме латинских символов, цифр и
всяких @#%^^&*()?
Желательно средствами баш/sed и т.д., допускаются перл и/или питон.

Заранее спасибо.

-- 
Best regards,
 Teimuraz Abashidze
--------------------------------------------
Linux user #140208
---Visit my home page:
http://www.facebook.com/teimuraz.abashidze - FaceBook
http://forum.tbilicity.com - Тбилисский форум
http://raindi.ge/taichi - Тайцзицзюань в Тбилиси
http://picasaweb.google.com/tgasoft/ - Мои фото
http://teimuraz1962.livejournal.com - Я в ЖЖ
kalia1962 - Skype

^ permalink raw reply	[flat|nested] 4+ messages in thread

* Re: [Comm] Конверт в AASCII
  2011-11-09 13:36 [Comm] Конверт в AASCII Teimuraz Abashidze
@ 2011-11-09 14:03 ` Yury Aliaev
  2011-11-09 14:21   ` Teimuraz Abashidze
  2011-11-09 15:06 ` Andrew G. Klepcha
  1 sibling, 1 reply; 4+ messages in thread
From: Yury Aliaev @ 2011-11-09 14:03 UTC (permalink / raw)
  To: ALT Linux Community general discussions

On 11/09/2011 07:36 AM, Teimuraz Abashidze wrote:

>
> В общем: как убрать из текст ВСЁ, кроме латинских символов, цифр и
> всяких @#%^^&*()?
> Желательно средствами баш/sed и т.д., допускаются перл и/или питон.
>

По-моему, на Перле всё элементарно, читаем посимвольно из stdin, если 
встречаем код >127, то пропускаем, иначе пишем в stdout. Если была бы 
известна кодировка исходных сообщений, то несложно и транслитерацию 
прикрутить :) Кстати, lynx вроде умеет сам транслит делать, вот и решение :)


^ permalink raw reply	[flat|nested] 4+ messages in thread

* Re: [Comm] Конверт в AASCII
  2011-11-09 14:03 ` Yury Aliaev
@ 2011-11-09 14:21   ` Teimuraz Abashidze
  0 siblings, 0 replies; 4+ messages in thread
From: Teimuraz Abashidze @ 2011-11-09 14:21 UTC (permalink / raw)
  To: ALT Linux Community general discussions

2011/11/9 Yury Aliaev:
> On 11/09/2011 07:36 AM, Teimuraz Abashidze wrote:
>
>>
>> В общем: как убрать из текст ВСЁ, кроме латинских символов, цифр и
>> всяких @#%^^&*()?
>> Желательно средствами баш/sed и т.д., допускаются перл и/или питон.
>>
>
> По-моему, на Перле всё элементарно, читаем посимвольно из stdin, если
> встречаем код >127, то пропускаем, иначе пишем в stdout. Если была бы
> известна кодировка исходных сообщений, то несложно и транслитерацию
> прикрутить :) Кстати, lynx вроде умеет сам транслит делать, вот и решение :)

Боюсь, что это будет крайне медленно... К тому же кодировка  исходно
мейла может быть какой угодно.

Я уже решил эту задачку, оказывается, все не просто, а ОЧЕНЬ просто!

cat filename|tr -cd '\11\12\15\40-\176' - и все.
Всем спасибо, тема закрыта.

-- 
Best regards,
 Teimuraz Abashidze
--------------------------------------------
Linux user #140208
---Visit my home page:
http://www.facebook.com/teimuraz.abashidze - FaceBook
http://forum.tbilicity.com - Тбилисский форум
http://raindi.ge/taichi - Тайцзицзюань в Тбилиси
http://picasaweb.google.com/tgasoft/ - Мои фото
http://teimuraz1962.livejournal.com - Я в ЖЖ
kalia1962 - Skype

^ permalink raw reply	[flat|nested] 4+ messages in thread

* Re: [Comm] Конверт в AASCII
  2011-11-09 13:36 [Comm] Конверт в AASCII Teimuraz Abashidze
  2011-11-09 14:03 ` Yury Aliaev
@ 2011-11-09 15:06 ` Andrew G. Klepcha
  1 sibling, 0 replies; 4+ messages in thread
From: Andrew G. Klepcha @ 2011-11-09 15:06 UTC (permalink / raw)
  To: ALT Linux Community general discussions

В сообщении от 9 ноября 2011 15:36:16 автор Teimuraz Abashidze написал:
> Задача: некий файл нужно привести к 7-битному виду. Система отправки
> СМС по имейлу, посылаешь письмо на НОМЕР_МОБИЛЫ@НЕКИЙ_ДОМЕН, там оно
> обрабатывается и кладется в мейлбокс. Принимающий сервер - на винде
> плюс некая проприетарная ситема российской разработки, читающая почту
> с почтового сервака и отправляющая на СМС.
> 
> Почтовый сервер - Центос, плюс небольшой шелловский скрипт.
> 
> Присылаемый текст должен обрезаться до 160 символов, но так как
> отправлен может быть и HTML (что и делает как правило любимый
> АутГлюк), его нужно преобразовать в текст (lynx --dump INFILE >
> OUTFILE решает дело), при этом текст не должен содержать ничего
> "лишнего": кириллических или иных не-латинских символов, управляющих
> кодов и т.д., иначе принимающая система (которая получает письмо с
> Центоса и непосредственно занимается отправкой) шизеет и её нужно
> перегружать. Поменять тупую систему не предлагать, не мы делали...
> 
> В общем: как убрать из текст ВСЁ, кроме латинских символов, цифр и
> всяких @#%^^&*()?
> Желательно средствами баш/sed и т.д., допускаются перл и/или питон.
> 
> Заранее спасибо.

а strings не прокатит?

^ permalink raw reply	[flat|nested] 4+ messages in thread

end of thread, other threads:[~2011-11-09 15:06 UTC | newest]

Thread overview: 4+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2011-11-09 13:36 [Comm] Конверт в AASCII Teimuraz Abashidze
2011-11-09 14:03 ` Yury Aliaev
2011-11-09 14:21   ` Teimuraz Abashidze
2011-11-09 15:06 ` Andrew G. Klepcha

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git