ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] удалить одинаковые строки из разных файлов
@ 2005-05-03 12:26 Roman V. Tutov
  2005-05-03 12:42 ` Denis Kirienko
                   ` (2 more replies)
  0 siblings, 3 replies; 12+ messages in thread
From: Roman V. Tutov @ 2005-05-03 12:26 UTC (permalink / raw)
  To: Community

Здравствуйте, .

Мне стыдно задавать такой вопрос ...но что-то я своим умом не дохожу

Есть 2 файла . Больших . В них есть одинаковые строки . Их нужно
удалить .

Как это сделать.?

-- 
Тутов Роман Викторович 
Системный администратор
ASTON Agro Industrial Company Group 
Россия,344002, г.Ростов-на-Дону,Промзона "Заречная" 
ул.1-я Луговая,3 тел.: (863 2) 999049
JID:tutov@jabber.aston.ru
mailto:tutov@aston.ru



^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] удалить одинаковые строки из разных файлов
  2005-05-03 12:26 [Comm] удалить одинаковые строки из разных файлов Roman V. Tutov
@ 2005-05-03 12:42 ` Denis Kirienko
  2005-05-03 16:18   ` [Comm] " Michael Shigorin
  2005-05-03 12:43 ` [Comm] " Alex Gorbachenko
  2005-05-04  5:48 ` Alexey I. Froloff
  2 siblings, 1 reply; 12+ messages in thread
From: Denis Kirienko @ 2005-05-03 12:42 UTC (permalink / raw)
  To: community

Получил Tue, 3 May 2005 16:26:52 +0400 от Roman V. Tutov следующее
письмо:

> Мне стыдно задавать такой вопрос ...но что-то я своим умом не дохожу
> 
> Есть 2 файла . Больших . В них есть одинаковые строки . Их нужно
> удалить .

Штатными средствами, похоже, что никак. Надо программу писать.
Хотя не исключаю, что здесь найдутся специалисты, которые смогут это
сварганить на bash+gnu tools. Ну, например, бежим циклом по строкам
одного файла, грепим второй файл на предмет наличия этой строки, в
зависимости от результата выводим или нет строку в новый файл.

Такое тупое решение будет работать за n*m действий, где n и m -
количество строк в файлах. Более продвинутое (сначала отсортировать
строки, затем бежим по одному файлу и ищем эту строку в другом файле
бинарным поиском)- за (n+m)(log n + log m) действий. Так что,
возможно, если файлы большие - то имеет смысл и самому написать.

--
Денис



^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] удалить одинаковые строки из разных файлов
  2005-05-03 12:26 [Comm] удалить одинаковые строки из разных файлов Roman V. Tutov
  2005-05-03 12:42 ` Denis Kirienko
@ 2005-05-03 12:43 ` Alex Gorbachenko
  2005-05-03 12:44   ` Michael Isachenkov
  2005-05-03 12:48   ` Denis Kirienko
  2005-05-04  5:48 ` Alexey I. Froloff
  2 siblings, 2 replies; 12+ messages in thread
From: Alex Gorbachenko @ 2005-05-03 12:43 UTC (permalink / raw)
  To: community

[-- Attachment #1: Type: text/plain, Size: 226 bytes --]

On Вторник 03 Май 2005 16:26, Roman V. Tutov wrote:

> Есть 2 файла . Больших . В них есть одинаковые строки . Их нужно
> удалить .

> Как это сделать.?

cat /path/to/file | sort | uniq > /path/to/file.uniq

-- 
KMail: 1.8.50

[-- Attachment #2: Type: application/pgp-signature, Size: 190 bytes --]

^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] удалить одинаковые строки из разных файлов
  2005-05-03 12:43 ` [Comm] " Alex Gorbachenko
@ 2005-05-03 12:44   ` Michael Isachenkov
  2005-05-03 12:48   ` Denis Kirienko
  1 sibling, 0 replies; 12+ messages in thread
From: Michael Isachenkov @ 2005-05-03 12:44 UTC (permalink / raw)
  To: community

> cat /path/to/file | sort | uniq > /path/to/file.uniq

Убивство. Меняет порядок строк в файле.

-- 
Best regards, Michael Isachenkov


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] удалить одинаковые строки из разных файлов
  2005-05-03 12:43 ` [Comm] " Alex Gorbachenko
  2005-05-03 12:44   ` Michael Isachenkov
@ 2005-05-03 12:48   ` Denis Kirienko
  2005-05-03 13:05     ` Alex Gorbachenko
  1 sibling, 1 reply; 12+ messages in thread
From: Denis Kirienko @ 2005-05-03 12:48 UTC (permalink / raw)
  To: community

Получил Tue, 3 May 2005 16:43:54 +0400 от Alex Gorbachenko следующее
письмо:

> > Есть 2 файла . Больших . В них есть одинаковые строки . Их нужно
> > удалить .
> 
> > Как это сделать.?
> 
> cat /path/to/file | sort | uniq > /path/to/file.uniq

Написано про 2 файла. Я понял это так, что нужно из одного файла
удалить строки, которые есть в другом файле. Кроме того, предложенный
Вами метод не является хорошим, поскольку меняет порядок строк в
исходном файле, о допустимости чего в исходном письме речи не шло.

--
Денис



^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] удалить одинаковые строки из разных файлов
  2005-05-03 12:48   ` Denis Kirienko
@ 2005-05-03 13:05     ` Alex Gorbachenko
  0 siblings, 0 replies; 12+ messages in thread
From: Alex Gorbachenko @ 2005-05-03 13:05 UTC (permalink / raw)
  To: community

[-- Attachment #1: Type: text/plain, Size: 179 bytes --]

On Вторник 03 Май 2005 16:48, Denis Kirienko wrote:

> Я понял это так, что нужно из одного файла
> удалить строки, которые есть в другом файле.

ой. и правда.

-- 
KMail: 1.8.50

[-- Attachment #2: Type: application/pgp-signature, Size: 190 bytes --]

^ permalink raw reply	[flat|nested] 12+ messages in thread

* [Comm] Re: удалить одинаковые строки из разных файлов
  2005-05-03 12:42 ` Denis Kirienko
@ 2005-05-03 16:18   ` Michael Shigorin
  2005-05-04  5:02     ` Denis Kirienko
  0 siblings, 1 reply; 12+ messages in thread
From: Michael Shigorin @ 2005-05-03 16:18 UTC (permalink / raw)
  To: community

On Tue, May 03, 2005 at 04:42:40PM +0400, Denis Kirienko wrote:
> > Есть 2 файла . Больших . В них есть одинаковые строки . Их
> > нужно удалить .
> Штатными средствами, похоже, что никак.

comm

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] Re: удалить одинаковые строки из разных файлов
  2005-05-03 16:18   ` [Comm] " Michael Shigorin
@ 2005-05-04  5:02     ` Denis Kirienko
  2005-05-04 14:17       ` Michael Shigorin
  0 siblings, 1 reply; 12+ messages in thread
From: Denis Kirienko @ 2005-05-04  5:02 UTC (permalink / raw)
  To: community

Получил Tue, 3 May 2005 19:18:16 +0300 от Michael Shigorin следующее
письмо:

> > > Есть 2 файла . Больших . В них есть одинаковые строки . Их
> > > нужно удалить .
> > Штатными средствами, похоже, что никак.
> 
> comm

О как, никогда про такую не слышал. Век живи, ...
Но, опять же, это решение годится только если разрешается переставлять
строки в исходных файлах.

--
Денис



^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] удалить одинаковые строки из разных файлов
  2005-05-03 12:26 [Comm] удалить одинаковые строки из разных файлов Roman V. Tutov
  2005-05-03 12:42 ` Denis Kirienko
  2005-05-03 12:43 ` [Comm] " Alex Gorbachenko
@ 2005-05-04  5:48 ` Alexey I. Froloff
  2005-05-04  6:13   ` Re[2]: " Roman V. Tutov
  2 siblings, 1 reply; 12+ messages in thread
From: Alexey I. Froloff @ 2005-05-04  5:48 UTC (permalink / raw)
  To: ALT Linux Community

[-- Attachment #1: Type: text/plain, Size: 414 bytes --]

* Roman V. Tutov <tutov@> [050503 16:28]:
> Есть 2 файла . Больших . В них есть одинаковые строки . Их нужно
> удалить .
Рискну предложить, правда за результат не отвечаю...

fgrep -f file.one file.two > file.two.new
fgrep -f file.two file.one > file.one.new

-- 
Regards, Sir Raorn.
-------------------
#chkconfig holywar on
#service holywar start
starting holywar: [DONE]

		-- gns in talk-room@

[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re[2]: [Comm] удалить одинаковые строки из разных файлов
  2005-05-04  5:48 ` Alexey I. Froloff
@ 2005-05-04  6:13   ` Roman V. Tutov
  2005-05-04  6:54     ` Alexey I. Froloff
  0 siblings, 1 reply; 12+ messages in thread
From: Roman V. Tutov @ 2005-05-04  6:13 UTC (permalink / raw)
  To: Alexey I. Froloff

Здравствуйте, Alexey.

Вы писали 4 мая 2005 г., 9:48:02:

AIF> * Roman V. Tutov <tutov@> [050503 16:28]:
>> Есть 2 файла . Больших . В них есть одинаковые строки . Их нужно
>> удалить .
AIF> Рискну предложить, правда за результат не отвечаю...

AIF> fgrep -f file.one file.two > file.two.new
AIF> fgrep -f file.two file.one > file.one.new
Вот это помогло . Правда с ключиком -v

Всем большое спасибо

-- 
Тутов Роман Викторович 
Системный администратор
ASTON Agro Industrial Company Group 
Россия,344002, г.Ростов-на-Дону,Промзона "Заречная" 
ул.1-я Луговая,3 тел.: (863 2) 999049
JID:tutov@jabber.aston.ru
mailto:tutov@aston.ru



^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [Comm] удалить одинаковые строки из разных файлов
  2005-05-04  6:13   ` Re[2]: " Roman V. Tutov
@ 2005-05-04  6:54     ` Alexey I. Froloff
  0 siblings, 0 replies; 12+ messages in thread
From: Alexey I. Froloff @ 2005-05-04  6:54 UTC (permalink / raw)
  To: ALT Linux Community

[-- Attachment #1: Type: text/plain, Size: 476 bytes --]

* Roman V. Tutov <tutov@> [050504 10:15]:
> AIF> fgrep -f file.one file.two > file.two.new
> AIF> fgrep -f file.two file.one > file.one.new
> Вот это помогло .
А ресурсов сколько оно от'ело?

> Правда с ключиком -v
Да, забыл.

> Всем большое спасибо

-- 
Regards, Sir Raorn.
-------------------
По "техническим причинам" я буду молчать или реагировать с бооольшой
задержкой на все почтовое в лучшем случае до понедельника следующей недели.
		-- ldv in devel@

[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 12+ messages in thread

* [Comm] Re: удалить одинаковые строки из разных файлов
  2005-05-04  5:02     ` Denis Kirienko
@ 2005-05-04 14:17       ` Michael Shigorin
  0 siblings, 0 replies; 12+ messages in thread
From: Michael Shigorin @ 2005-05-04 14:17 UTC (permalink / raw)
  To: community

On Wed, May 04, 2005 at 09:02:12AM +0400, Denis Kirienko wrote:
> > > > Есть 2 файла . Больших . В них есть одинаковые строки .
> > > > Их нужно удалить .
> > > Штатными средствами, похоже, что никак.
> > comm
> О как, никогда про такую не слышал. Век живи, ...
> Но, опять же, это решение годится только если разрешается
> переставлять строки в исходных файлах.

Ммм.... да, в той задаче, для которой чуть не сел своё писать --
это можно было делать.  Года три тому или четыре.

Кажется, иначе вычислительная сложность задачи всё равно сводится
к (грубо говоря) sort+comm.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 12+ messages in thread

end of thread, other threads:[~2005-05-04 14:17 UTC | newest]

Thread overview: 12+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2005-05-03 12:26 [Comm] удалить одинаковые строки из разных файлов Roman V. Tutov
2005-05-03 12:42 ` Denis Kirienko
2005-05-03 16:18   ` [Comm] " Michael Shigorin
2005-05-04  5:02     ` Denis Kirienko
2005-05-04 14:17       ` Michael Shigorin
2005-05-03 12:43 ` [Comm] " Alex Gorbachenko
2005-05-03 12:44   ` Michael Isachenkov
2005-05-03 12:48   ` Denis Kirienko
2005-05-03 13:05     ` Alex Gorbachenko
2005-05-04  5:48 ` Alexey I. Froloff
2005-05-04  6:13   ` Re[2]: " Roman V. Tutov
2005-05-04  6:54     ` Alexey I. Froloff

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git