From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Date: Tue, 3 May 2005 16:42:40 +0400 From: Denis Kirienko To: community@altlinux.ru Subject: Re: [Comm] =?KOI8-R?Q?=D5=C4=C1=CC=C9=D4=D8_=CF=C4=C9=CE=C1=CB=CF?= =?KOI8-R?Q?=D7=D9=C5_=D3=D4=D2=CF=CB=C9_=C9=DA_=D2=C1=DA=CE=D9=C8_=C6=C1?= =?KOI8-R?Q?=CA=CC=CF=D7?= Message-Id: <20050503164240.20a88368.dk_for_lists@lmsh.edu.ru> In-Reply-To: <64247015.20050503162652@aston.ru> References: <64247015.20050503162652@aston.ru> X-Mailer: Sylpheed version 0.9.10 (GTK+ 1.2.10; i586-alt-linux-gnu) Mime-Version: 1.0 Content-Type: text/plain; charset=KOI8-R Content-Transfer-Encoding: 8bit X-Authenticated-Sender: kirienko@lmsh.edu.ru X-Spam-Processed: lmsh.edu.ru, Tue, 03 May 2005 16:45:18 +0400 (not processed: message from valid local sender) X-MDRemoteIP: 83.237.52.143 X-Return-Path: dk_for_lists@lmsh.edu.ru X-MDaemon-Deliver-To: community@altlinux.ru X-MDAV-Processed: lmsh.edu.ru, Tue, 03 May 2005 16:45:20 +0400 X-BeenThere: community@altlinux.ru X-Mailman-Version: 2.1.5 Precedence: list Reply-To: community@altlinux.ru List-Id: Mailing list for ALT Linux users List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Tue, 03 May 2005 12:43:30 -0000 Archived-At: List-Archive: List-Post: Получил Tue, 3 May 2005 16:26:52 +0400 от Roman V. Tutov следующее письмо: > Мне стыдно задавать такой вопрос ...но что-то я своим умом не дохожу > > Есть 2 файла . Больших . В них есть одинаковые строки . Их нужно > удалить . Штатными средствами, похоже, что никак. Надо программу писать. Хотя не исключаю, что здесь найдутся специалисты, которые смогут это сварганить на bash+gnu tools. Ну, например, бежим циклом по строкам одного файла, грепим второй файл на предмет наличия этой строки, в зависимости от результата выводим или нет строку в новый файл. Такое тупое решение будет работать за n*m действий, где n и m - количество строк в файлах. Более продвинутое (сначала отсортировать строки, затем бежим по одному файлу и ищем эту строку в другом файле бинарным поиском)- за (n+m)(log n + log m) действий. Так что, возможно, если файлы большие - то имеет смысл и самому написать. -- Денис