क्या है की उम्र में जैसे बटन का भविष्य कृत्रिम होशियारी? मैक्स लेवचिन– पेपल कोफ़ाउंडर और सीईओ की पुष्टि – एआई को प्रशिक्षित करने के लिए डेटा को पसंद करने के लिए एक नई और बेहद मूल्यवान भूमिका देखती है, जो कि एक मानव निर्णय लेने वाले के साथ निष्कर्ष पर पहुंचने के लिए और अधिक निष्कर्ष पर पहुंचने के लिए है।
यह मशीन लर्निंग में एक प्रसिद्ध प्रश्न है कि एक स्पष्ट इनाम समारोह के साथ प्रस्तुत एक कंप्यूटर अपने प्रदर्शन को बेहतर बनाने के लिए अथक सुदृढीकरण सीखने में संलग्न होगा और उस इनाम को अधिकतम करेगा-लेकिन यह अनुकूलन पथ अक्सर एआई सिस्टम को बहुत अलग परिणामों की ओर ले जाता है, जो मानव निर्णय का प्रयोग करने वाले मनुष्यों के परिणामस्वरूप बहुत अलग परिणामों की ओर जाता है।
एक सुधारात्मक बल का परिचय देने के लिए, एआई डेवलपर्स अक्सर मानव प्रतिक्रिया (आरएलएचएफ) से सुदृढीकरण सीखने को कहा जाता है। अनिवार्य रूप से वे पैमाने पर एक मानव अंगूठा डाल रहे हैं क्योंकि कंप्यूटर वास्तविक लोगों की वास्तविक वरीयताओं को दर्शाते हुए डेटा पर प्रशिक्षण देकर अपने मॉडल पर आता है। लेकिन वह मानव वरीयता डेटा कहां से आता है, और इनपुट के मान्य होने के लिए इसकी कितनी आवश्यकता है? अब तक, यह RLHF के साथ समस्या रही है: यह एक महंगा तरीका है यदि उसे प्रतिक्रिया दर्ज करने के लिए मानव पर्यवेक्षकों और एनोटेटर को काम पर रखने की आवश्यकता है।
और यह वह समस्या है जो लेविचिन को लगता है कि इसे समान बटन द्वारा हल किया जा सकता है। वह उस संचित संसाधन को देखता है जो आज बैठता है फेसबुकमानव वरीयता डेटा पर एक बुद्धिमान एजेंट को प्रशिक्षित करने के इच्छुक किसी भी डेवलपर के लिए एक गॉडसेंड के रूप में हाथ। और कितना बड़ा सौदा है? “मैं तर्क दूंगा कि फेसबुक का सबसे मूल्यवान चीजों में से एक है, जो कि डेटा को पसंद करने वाला पहाड़ है,” लेविचिन ने हमें बताया। दरअसल, आर्टिफिशियल इंटेलिजेंस के विकास में इस विभक्ति बिंदु पर, “एआई मॉडल के प्रशिक्षण के लिए उपयोग करने के लिए मनुष्यों द्वारा” क्या सामग्री पसंद की जाती है, तक पहुंच, शायद इंटरनेट पर विलक्षण रूप से सबसे मूल्यवान चीजों में से एक है। “
जबकि लेविचिन एआई को जैसे बटन के माध्यम से मानव वरीयताओं से सीखता है, एआई पहले से ही इन वरीयताओं को पहले स्थान पर आकार देने के तरीके को बदल रहा है। वास्तव में, सोशल मीडिया प्लेटफ़ॉर्म सक्रिय रूप से एआई का उपयोग कर रहे हैं न केवल पसंद का विश्लेषण करने के लिए, बल्कि उन्हें भविष्यवाणी करने के लिए – संभावित रूप से बटन को अप्रचलित कर रहे हैं।
यह हमारे लिए एक हड़ताली अवलोकन था, क्योंकि जैसा कि हमने ज्यादातर लोगों से बात की थी, भविष्यवाणियां ज्यादातर एक और कोण से आईं, यह बताते हुए कि जैसे बटन एआई के प्रदर्शन को प्रभावित करेगा, लेकिन एआई कैसे बटन की दुनिया को बदल देगा। पहले से ही, हमने सुना, सोशल मीडिया एल्गोरिदम को बेहतर बनाने के लिए एआई लागू किया जा रहा है। 2024 की शुरुआत में, उदाहरण के लिए, फेसबुक ने प्रयोग किया एआई का उपयोग करना एल्गोरिथ्म को फिर से डिज़ाइन करने के लिए जो उपयोगकर्ताओं को रील वीडियो की सिफारिश करता है। क्या यह अनुमान लगाने के लिए चर के बेहतर भार के साथ आ सकता है कि उपयोगकर्ता किस वीडियो को आगे देखना चाहता है? इस शुरुआती परीक्षण के परिणाम से पता चला कि यह हो सकता है: एआई को लंबे समय में भुगतान किए गए कार्य के लिए लागू करना – प्रदर्शन मीट्रिक फेसबुक को बढ़ावा देने की उम्मीद थी।
जब हमने पूछा YouTube कॉफाउंडर स्टीव चेन जैसे भविष्य की तरह बटन के लिए क्या है, उन्होंने कहा, “मुझे कभी -कभी आश्चर्य होता है कि क्या एआई की आवश्यकता होगी जब एआई को 100 प्रतिशत सटीकता के साथ एल्गोरिथ्म को बताने के लिए पर्याप्त रूप से परिष्कृत किया जाता है कि आप खुद को देखने और साझा करने वाले पैटर्न के आधार पर आगे क्या देखना चाहते हैं।
हालांकि, उन्होंने बताया कि एक कारण की तरह बटन की आवश्यकता हो सकती है, यह है कि जीवन की घटनाओं या स्थितियों के कारण जरूरतों को देखने में तेज या अस्थायी परिवर्तनों को संभालना है। “ऐसे दिन हैं जब मैं ऐसी सामग्री देखना चाहता हूं जो मेरे बच्चों के लिए थोड़ा अधिक प्रासंगिक हो,” उन्होंने कहा। चेन ने यह भी समझाया कि विज्ञापनदाताओं को आकर्षित करने में अपनी भूमिका के कारण जैसे बटन की लंबी उम्र हो सकती है – दर्शकों और रचनाकारों के साथ -साथ अन्य प्रमुख समूह – क्योंकि उन तीन समूहों को जोड़ने के लिए सबसे सरल संभव काज के रूप में कार्य करता है। एक नल के साथ, एक दर्शक एक साथ सामग्री प्रदाता को सीधे प्रशंसा और प्रतिक्रिया देता है और विज्ञापनदाता को सगाई और वरीयता के साक्ष्य।