ocehb: (Default)
[personal profile] ocehb
http://alsou.ru/cgi-bin/badus/badtest.pl

как обычно, пропускает слова с грамматическими ошбками, с знаками препинания в середине слова, etc...

Date: 2004-03-15 01:48 pm (UTC)
From: [identity profile] ccn.livejournal.com
коллекционируешь?

Date: 2004-03-16 05:43 am (UTC)
From: [identity profile] ccn.livejournal.com
в исходниках одного из форумов (encore) меня позабавили комментарии автора
с извинениями за использование в коде "антимата" ненормативной лексики.
Конечно, пропустить эту лексику через tr///, чтоб пощадить ранимые
души перл-программистов ему в голову не пришло :)

Date: 2004-03-16 07:25 am (UTC)
From: [identity profile] ccn.livejournal.com
Abigail`у не лень было
http://search.cpan.org/src/ABIGAIL/Regexp-Common-2.113/lib/Regexp/Common/profanity.pm

Date: 2004-03-16 07:33 am (UTC)
From: [identity profile] ccn.livejournal.com
я о том, что если лень, то зачем напрягать себя извинениями, когда их объем больше чем шифрующий код.

Date: 2004-03-16 10:49 pm (UTC)
From: [identity profile] ex-7021705.livejournal.com
Где-то проскакивала инфа насчёт восприятия человеком слов в целом. Наука под названием психология вроде как установила, что при чтении человеческий глаз движется не плавно по тексту, а скачет (каждое такое движение называется саккадой), плюс зачастую воспринимает слова не как упорядоченный набор букв, а как просто набор букв, отсюда, если я скажем, напишу вместо слова "херовина", слово "хеовирна", то вы всё равно поймёте, что я имел ввиду. А отсечь такие слова ну очень трудно, не фильтранув что-то нужное и нематерное.
По-моему эта фича уже используется спамерами для обхода байесовских фильтров спама.

Profile

ocehb: (Default)
ocehb

January 2021

S M T W T F S
     12
345 6789
10111213141516
17181920212223
24252627282930
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 5th, 2026 06:47 pm
Powered by Dreamwidth Studios