From: "Anatol B. Bazjukin" <anatol@VB3397.spb.edu> To: spider <community@altlinux.ru> Subject: Re: [Comm] Предложение: Тематический классификатор в поле <Тема> Date: Fri, 27 May 2005 02:05:50 +0400 Message-ID: <1207395159.20050527020550@vb3397.spb.edu> (raw) In-Reply-To: <42960F2D.1050805@lsi.bas-net.by> Hello spider, Thursday, May 26, 2005, 10:02:21 PM, you wrote: s> Предложение: построить классификатор тематики и указывать s> сайн класса в сабже. Например, s> [mmedia]Не работает xmms:-( s> [devel]А где лежит qmake s> и т.п. К сожалению, это пересекающиеся множества, если не по Subject, то по Text точно. Я в одном из тредов приводил частотный анализ слов в Subject для [Comm]. Всего выделено 8958 слов, большая часть которых встречаются редко. 8607 реже 10 раз. Низкое качество классификации связано с отсутствием минимальной стандартизации вопросов в Subject. Ну что за тема √ ⌠1001 вопрос от новичка■(но в тексте может быть вполне разумные вопросы). Предложения: √ один вопрос √ один тред - в заголовке указание пакета, устройства, сервиса, то есть некие ключевые слова, а не эмоции и паразитные слова. Это менее строгое требование, чем цитируемое предложение, но оно легче реализуемо. Раскладывание тредов по папочкам очень увлекательное занятие, но опыт показывает, что проще свалить все в одну и выполнить search(google - ау..) У меня на мыше с папкой 70 тыс. писем поиск занимает максимум 5 минут в самом тяжелом случае. И недаром в offtopic'е разгорелось соревнование фирм в создании систем локального поиска. -- Best regards, Anatol
next prev parent reply other threads:[~2005-05-26 22:05 UTC|newest] Thread overview: 25+ messages / expand[flat|nested] mbox.gz Atom feed top 2005-05-26 18:02 spider 2005-05-26 19:04 ` Michael Shigorin 2005-05-27 7:46 ` [Comm] Предложение: Тематический классификатор в поле < Тема> Денис Гайнцев 2005-05-27 7:49 ` [Comm] " Michael Shigorin 2005-05-27 8:33 ` [Comm] " Pavel N. Solovyov 2005-05-27 8:40 ` Olvin 2005-05-27 9:18 ` Re[2]: " Беляев В. Н. 2005-05-27 12:12 ` Olvin 2005-05-27 12:14 ` Olvin 2005-05-28 4:36 ` Pavel N. Solovyov 2005-06-01 12:43 ` spider 2005-06-01 12:52 ` Алексей Синицын 2005-06-01 12:55 ` Vasya Makarov 2005-05-29 9:12 ` Владимир Гусев 2005-05-29 13:26 ` [Comm] [JT] " Anatol B. Bazjukin 2005-05-27 9:45 ` [Comm] Предложение: Т ематический классифик атор " Алексей Синицын 2005-05-27 11:32 ` [Comm] Re: Предложение: Тематический классификатор в поле < Тема> [JT] Денис Гайнцев 2005-05-27 15:40 ` Michael Shigorin 2005-05-27 15:52 ` Michael Isachenkov 2005-05-30 15:08 ` Денис Гайнцев 2005-05-26 22:05 ` Anatol B. Bazjukin [this message] 2005-05-27 3:47 ` [Comm] [wiki] Re: Предложение: Тематический классификатор в поле <Тема> Michael Shigorin 2005-06-01 13:24 ` [Comm] " spider 2005-06-02 6:04 ` [Comm] [JT] " Vladimir V Kamarzin 2005-06-02 13:42 ` [Comm] " Michael Shigorin
Reply instructions: You may reply publicly to this message via plain-text email using any one of the following methods: * Save the following mbox file, import it into your mail client, and reply-to-all from there: mbox Avoid top-posting and favor interleaved quoting: https://en.wikipedia.org/wiki/Posting_style#Interleaved_style * Reply using the --to, --cc, and --in-reply-to switches of git-send-email(1): git send-email \ --in-reply-to=1207395159.20050527020550@vb3397.spb.edu \ --to=anatol@vb3397.spb.edu \ --cc=community@altlinux.ru \ /path/to/YOUR_REPLY https://kernel.org/pub/software/scm/git/docs/git-send-email.html * If your mail client supports setting the In-Reply-To header via mailto: links, try the mailto: link
ALT Linux Community general discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 community community/ http://lore.altlinux.org/community \ mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com public-inbox-index community Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.community AGPL code for this site: git clone https://public-inbox.org/public-inbox.git