Kaspersky Lab obdržela americký patent pro své inovativní technologii pro identifikaci elektronických textových zpráv jako spam.
Spam je příčinou tak velké škody pro podniky i spotřebitele. Nevyžádané e-mailové zprávy často obsahují podvodné nabídky, škodlivé přílohy nebo odkazy na infikované webové stránky.
Jeden z nejpopulárnějších a nejefektivnějších způsobů, jak bojovat proti nežádoucí e-mailu je třídit zprávy podle toho, zda obsahují klíčová slova a fráze typické pro spam. Tato praxe nejen umožňuje nastavit, aby systém byl zablokován nové typy spamu, ale také poskytuje vysokou míru detekce s minimálním počtu falešných poplachů.
Patentovaný elektronické textové zprávy jsou klasifikovány na základě hierarchický seznam kategorií. Každá kategorie je definována souborem klíčových slov a textových šablon. Příchozí zpráva je charakterizovat takto: za prvé, je jeho hmotnost vypočítá s ohledem na jednotlivé kategorie obsahuje klíčová slova najdete v e-mailu. Pak určuje stupeň podobnosti ke každému z šablon. Pokud zpráva obsahuje řadu klíčových slov nebo je dostatečně podobná jedné ze šablon, je zařazen do kategorie, včetně spamu.
Novinky Kategorie mohou být také přidat ručně, ukazuje klíčová slova a vytváření šablon. Kromě toho může každý z nich se dělí na podkategorie, které bude poskytovat podrobnější klasifikace. Textové zprávy mohou být rovněž pre-zpracovávány pomocí technik, jako je automatické rozpoznávání jazyka, odstranění často používaných slov a filtrování šumu.
Žádné komentáře:
Okomentovat