ऐसे फ़िल्टर जो पलटवार करते हैं

अगस्त 2003

हम बेयसियन स्पैम फ़िल्टर की सटीकता में सुधार कर सकते हैं यदि वे यह देखने के लिए लिंक का पालन करते हैं कि दूसरे छोर पर क्या इंतजार कर रहा है। death2spam के रिचर्ड जोव्सी अब सीमांत मामलों में ऐसा करते हैं, और रिपोर्ट करते हैं कि यह अच्छी तरह से काम करता है।

इसे केवल सीमांत मामलों में ही क्यों करें? और इसे केवल एक बार ही क्यों करें?

जैसा कि मैंने क्या फ़िल्टर स्पैम को खत्म कर देंगे? में उल्लेख किया है, स्पैम में सभी यूआरएल का पालन करने का एक मजेदार दुष्प्रभाव होगा। अगर लोकप्रिय ईमेल क्लाइंट स्पैम को फ़िल्टर करने के लिए ऐसा करते हैं, तो स्पैमर के सर्वर गंभीर रूप से प्रभावित होंगे। जितना अधिक मैं इस बारे में सोचता हूं, यह विचार उतना ही बेहतर लगता है। यह केवल मनोरंजक नहीं है; यह स्पैमर पर अधिक पूरी तरह से लक्षित जवाबी हमले की कल्पना करना कठिन होगा।

इसलिए मैं उन लोगों के लिए एक अतिरिक्त सुविधा का सुझाव देना चाहता हूं जो स्पैम फ़िल्टर पर काम कर रहे हैं: एक "दंड" मोड जो, यदि चालू किया जाता है, तो प्रत्येक यूआरएल को स्पाइडर करेगा एक संदिग्ध स्पैम में n बार, जहां n उपयोगकर्ता द्वारा सेट किया जा सकता है। [1]

जैसा कि कई लोगों ने नोट किया है, वर्तमान ईमेल सिस्टम के साथ समस्याओं में से एक यह है कि यह बहुत निष्क्रिय है। यह जो आप इसे बताते हैं वह करता है। अब तक समस्या को ठीक करने के लिए सभी सुझाव नए प्रोटोकॉल शामिल करते हैं। यह एक नहीं करेगा।

यदि व्यापक रूप से उपयोग किया जाता है, तो ऑटो-रिट्रीविंग स्पैम फ़िल्टर बना देंगे ईमेल सिस्टम रिबाउंड। स्पैम की विशाल मात्रा, जो अब तक स्पैमर के पक्ष में काम कर रही थी, अब उसके खिलाफ काम करेगी, जैसे एक शाखा उसके चेहरे पर वापस आ रही है। ऑटो-रिट्रीविंग स्पैम फ़िल्टर ड्राइव करेंगे स्पैमर के लागत ऊपर, और उसकी बिक्री नीचे: उसका बैंडविड्थ उपयोग छत से गुजर जाएगा, और उसके सर्वर एक लोड के नीचे रुक जाएंगे, जो उन्हें अनुपलब्ध बना देगा उन लोगों के लिए जिन्होंने स्पैम का जवाब दिया होगा।

एक घंटे में एक मिलियन ईमेल पंप करें, एक घंटे में आपके सर्वर पर एक मिलियन हिट प्राप्त करें।

हम यह सुनिश्चित करना चाहेंगे कि यह केवल संदिग्ध स्पैम के लिए किया जाता है। एक नियम के रूप में, लाखों लोगों को भेजा गया कोई भी यूआरएल स्पैम यूआरएल होने की संभावना है, इसलिए हर ईमेल में हर http अनुरोध सबमिट करना लगभग हर समय ठीक काम करेगा। लेकिन कुछ मामले हैं जहां यह सच नहीं है: यूआरएल याहू मेल और हॉटमेल जैसी मुफ्त ईमेल सेवाओं से भेजे गए मेल के नीचे, उदाहरण के लिए।

ऐसी साइटों की सुरक्षा के लिए, और दुरुपयोग को रोकने के लिए, ऑटो-रिट्रीवल को स्पैमवर्टाइज्ड साइटों की ब्लैकलिस्ट के साथ जोड़ा जाना चाहिए। केवल ब्लैकलिस्ट में मौजूद साइटों को क्रॉल किया जाएगा, और साइटों को ब्लैकलिस्ट किया जाएगा केवल मनुष्यों द्वारा निरीक्षण के बाद। स्पैम का जीवनकाल कम से कम कई घंटे होना चाहिए, इसलिए नई साइट को बढ़ावा देने वाले स्पैम में हस्तक्षेप करने के लिए इस तरह की सूची को समय पर अपडेट करना आसान होना चाहिए। [2]

उच्च-मात्रा वाला ऑटो-रिट्रीवल केवल उपयोगकर्ताओं के लिए व्यावहारिक होगा उच्च-बैंडविड्थ पर कनेक्शन, लेकिन स्पैमर को गंभीर परेशानी देने के लिए उनमें से पर्याप्त हैं। वास्तव में, यह समाधान बड़े करीने से समस्या को दर्शाता है। स्पैम के साथ समस्या यह है कि कुछ भोले लोगों तक पहुँचने के लिए स्पैमर भेजता है सभी को मेल। गैर-भोले प्राप्तकर्ता केवल संपार्श्विक क्षति हैं। लेकिन गैर-भोले बहुमत तब तक स्पैम प्राप्त करना बंद नहीं करेंगे जब तक वे रोक नहीं सकते (या धमकी नहीं दे सकते) भोले को इससे जवाब देने से रोकें। ऑटो-रिट्रीविंग स्पैम फ़िल्टर ऑफर उन्हें ऐसा करने का एक तरीका।

क्या इससे स्पैम खत्म हो जाएगा? बिल्कुल नहीं। सबसे बड़े स्पैमर शायद अपने सर्वर को ऑटो-रिट्रीविंग से बचा सकते हैं फ़िल्टर। हालांकि, उनके लिए सबसे आसान और सबसे सस्ता तरीका ऐसा करने के लिए उनके मेल में काम करने वाले अनसब्सक्राइब लिंक शामिल करना होगा। और यह छोटी मछली के लिए एक आवश्यकता होगी, और "वैध" साइटों के लिए जिन्होंने उन्हें बढ़ावा देने के लिए स्पैमर को काम पर रखा था। इसलिए यदि ऑटो-रिट्रीविंग फ़िल्टर व्यापक हो जाते हैं, वे ऑटो-अनसब्सक्राइबिंग फ़िल्टर बन जाएँगे।

इस परिदृश्य में, स्पैम, ओएस क्रैश, वायरस और पॉपअप की तरह, उन प्लेग में से एक बन जाएगा जो केवल उन लोगों को प्रभावित करते हैं जो सही सॉफ़्टवेयर का उपयोग करने के लिए परेशान नहीं होते हैं।

नोट्स

[1] ऑटो-रिट्रीविंग फ़िल्टर को रीडायरेक्ट का पालन करना होगा, और कुछ मामलों में (जैसे एक पृष्ठ जो केवल कहता है "यहां क्लिक करें") लिंक के एक से अधिक स्तर का पालन करें। यह भी सुनिश्चित करें कि http अनुरोध लोकप्रिय वेब ब्राउज़र के समान हैं, जिसमें क्रम और रेफरर शामिल हैं।

अगर प्रतिक्रिया x समय सीमा के भीतर वापस नहीं आती है, तो डिफ़ॉल्ट करें कुछ काफी उच्च स्पैम संभावना के लिए।

n को स्थिर बनाने के बजाय, इसे एक अच्छा विचार हो सकता है इसे उन स्पैम की संख्या का एक फ़ंक्शन बनाएं जो देखे गए हैं साइट का उल्लेख करते हुए। यह दुरुपयोग और दुर्घटनाओं के खिलाफ एक और स्तर की सुरक्षा जोड़ देगा।

[2] इस लेख के मूल संस्करण में शब्द का उपयोग किया गया था "व्हाइटलिस्ट" "ब्लैकलिस्ट" के बजाय। हालांकि वे थे ब्लैकलिस्ट की तरह काम करने के लिए, मैं उन्हें व्हाइटलिस्ट कहना पसंद करता था क्योंकि इससे उन्हें कानूनी हमले के प्रति कम संवेदनशील बनाया जा सकता है। हालांकि, ऐसा लगता है कि इसने पाठकों को भ्रमित कर दिया है।

शायद कई ब्लैकलिस्ट होनी चाहिए। एकल बिंदु विफलता हमले और दुरुपयोग दोनों के प्रति कमजोर होगी।

धन्यवाद ब्रायन बर्टन, बिल येराज़ुनिस, डैन गिफिन, एरिक रेमंड, और रिचर्ड जोव्सी को इस के ड्राफ्ट पढ़ने के लिए।