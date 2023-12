Skrzynka mailowa bez spamu brzmi bajecznie, ale jednocześnie dość abstrakcyjnie. Google chwali się jednak tym, co osiągnęło w tej kwestii.

Google robi co może, żeby Gmail nie był śmietnikiem

Spam nie tylko jest irytujący, ale często bywa także niebezpieczny. W końcu najczęściej to właśnie przez podejrzane wiadomości mailowe możemy zostać ofiarą ataku phishingowego, oszustwa czy innych działań cyberprzestępców, co kończy się — jak każdy się może domyślić — w sposób niejednokrotnie tragiczny w skutkach. Do tego dochodzi fakt, że cyberprzestępcy są coraz sprytniejsi.

Spamerzy często używają znaków wyglądających podobnie do rzeczywistych liter, na przykład zamiast I używają l czy zamiast p wpisują q i tym podobne. To jednak nie wszystko, bo do tego dochodzi używanie niewidocznych znaków, upychanie słów kluczowych i inne sposoby manipulacji, których celem jest ominięcie sposobu klasyfikacji tekstu przez Gmaila. Teraz gigant z Mountain View chwali się jednak, że najnowsze sposoby Gmaila zapewniają 38% wzrost wykrywalności dzięki lepszej identyfikacji tekstu.

Co Google robi, żeby Gmail nie był przepełniony spamem?

Google przeciwdziała podejrzanym wiadomościom za pomocą RETVec — to sposób opracowany przez Google Research, który „pomaga modelom osiągnąć najnowocześniejszą wydajność klasyfikacji i drastycznie zmniejsza koszty obliczeń”, jednocześnie obsługując „każdy język i wszystkie znaki UTF-8 bez konieczności wstępnego przetwarzania tekstu”. Google informuje:

Modele wyszkolone za pomocą RETVec można bezproblemowo konwertować do TFLite dla urządzeń mobilnych i brzegowych dzięki natywnej implementacji w TensorFlow Text. Do wdrożenia modelu aplikacji internetowej zapewniamy implementację warstwy TensorflowJS dostępną na Githubie. Można także sprawdzić stronę demonstracyjną działającą w oparciu o model oparty na RETVec.

Jakie efekty przynosi RETVec? W Gmailu — jak informuje Google — rozwiązanie to miało poprawić „współczynnik wykrywania spamu w porównaniu z wartością bazową o 38%”, jednocześnie zmniejszając odsetek fałszywych alarmów o 19,4%.

Źródło: 9to5Google