From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: From: Ivan Kudryashov X-Mailer: The Bat! (v1.44) Organization: Жизни смысл угадав, удавился удав... X-Priority: 3 (Normal) Message-ID: <1809971171.20010329114600@chat.ru> To: "Yuri V. Anikin" Subject: Re[6]: [mdk-re] Blocklist for junkbuster In-reply-To: References: Mime-Version: 1.0 Content-Type: text/plain; charset=koi8-r Content-Transfer-Encoding: 8bit X-Authorized: jony Sender: mandrake-russian-admin@altlinux.ru Errors-To: mandrake-russian-admin@altlinux.ru X-BeenThere: mandrake-russian@altlinux.ru X-Mailman-Version: 2.0 Precedence: bulk Reply-To: mandrake-russian@altlinux.ru X-Reply-To: Ivan Kudryashov List-Help: List-Post: List-Subscribe: , List-Id: Mandrake/RE discussion list List-Unsubscribe: , List-Archive: Date: Thu Mar 29 11:37:12 2001 X-Original-Date: Thu, 29 Mar 2001 11:46:00 +0400 Archived-At: List-Archive: List-Post: Hello, Yuri V. Anikin! 29.03.2001 06:28:21, you wrote: YVA> Во-вторых, попытаюсь несколько пояснить ситуацию с фильтрацией YVA> "плохих" сайтов: в классе свободного доступа на машинах стоит Win98, YVA> защиты от изменения настроек у которого практически нет. Задача -- "мягко YVA> убрать" посетителей, мешающих тем, кто приходит действительно YVA> поработать. Один из способов (кстати, практически системнонезависимый) иметь актуальный список "плохих" сайтов (кстати, почему именно эротического содержания - любители разглядывать фото автомобилей с точки зрения траффика мало отличаются от порноманов ) - это просто регулярно проверять кэш прокси на наличие там "плохих" страниц (кстати, тут справится достаточно элементарный скрипт из find и нескольких операторов обвязки, а для разбора самих страниц можно привлечь немногим более сложную программу на C) и дописывать имена сайтов (можно домены) в файл блокировки, одновременно стирая их из кэша. Запускать этот скрипт автоматом раз в час, или как угодно, натравливая только на свежепоявившиеся файлы. Что характерно - этот способ не тормозит загрузку, потому что фильтр получается постмодерирующий. Посетители "наполнят" файлы блокировки за каких-нибудь пару-тройку дней. Но, кстати, надо иметь в виду то, что придётся принудительно _разрешать_ некоторые сайты, главным образом - поисковики. Потому что иначе после первого же деятеля, поискавшего в альтависте "hard porno", вся альтависта станет недоступна (критерий выполнится, потому что вся страница будет заполнена сплошными ключевыми словами). И вообще, к фильтрации надо аккуратно подходить, "плохие" слова часто встречаются во вполне невинных текстах. ------------------------------------------- С уважением, Ivan Kudryashov ICQ 1547081