neděle 28. listopadu 2010

Pokročilé metody identifikace spamu

Pokročilé metody identifikace spamu Kaspersky Lab obdržela americký patent pro své inovativní technologii pro identifikaci elektronických textových zpráv jako spam.

Spam je příčinou tak velké škody pro podniky i spotřebitele. Nevyžádané e-mailové zprávy často obsahují podvodné nabídky, škodlivé přílohy nebo odkazy na infikované webové stránky.

Jeden z nejpopulárnějších a nejefektivnějších způsobů, jak bojovat proti nežádoucí e-mailu je třídit zprávy podle toho, zda obsahují klíčová slova a fráze typické pro spam. Tato praxe nejen umožňuje nastavit, aby systém byl zablokován nové typy spamu, ale také poskytuje vysokou míru detekce s minimálním počtu falešných poplachů.

Patentovaný elektronické textové zprávy jsou klasifikovány na základě hierarchický seznam kategorií. Každá kategorie je definována souborem klíčových slov a textových šablon. Příchozí zpráva je charakterizovat takto: za prvé, je jeho hmotnost vypočítá s ohledem na jednotlivé kategorie obsahuje klíčová slova najdete v e-mailu. Pak určuje stupeň podobnosti ke každému z šablon. Pokud zpráva obsahuje řadu klíčových slov nebo je dostatečně podobná jedné ze šablon, je zařazen do kategorie, včetně spamu.

Novinky Kategorie mohou být také přidat ručně, ukazuje klíčová slova a vytváření šablon. Kromě toho může každý z nich se dělí na podkategorie, které bude poskytovat podrobnější klasifikace. Textové zprávy mohou být rovněž pre-zpracovávány pomocí technik, jako je automatické rozpoznávání jazyka, odstranění často používaných slov a filtrování šumu.

Žádné komentáře:

Okomentovat