چرا کمینه‌سازی داده به یک استراتژی محصول تبدیل می‌شود، نه...

کمینه سازی داده قبلاً بیشتر به عنوان یک اصل انطباقی مطرح می شد، چیزی از همان جنس که وکلای حریم خصوصی در بازبینی سیاست ها و چک لیست های تدارکاتی به آن اشاره می کردند. این چارچوب حالا دیگر خیلی محدود است. هرچه محصولات دیجیتال سیگنال های رفتاری بیشتری جمع آوری می کنند، هرچه سیستم های هوش مصنوعی ورودی های آموزشی بزرگ تری می بلعند، و هرچه نهادهای ناظر تصمیم های مربوط به چرخه عمر داده را با دقت بیشتری بررسی می کنند، کمینه سازی به یک استراتژی محصول تبدیل می شود. پرسش اصلی دیگر فقط این نیست که «اجازه داریم چه چیزی را جمع آوری کنیم؟» بلکه بیشتر این است که «محصول اساساً باید به چه چیزی نیاز داشته باشد؟»

این تغییر مهم است، چون تصمیم های مربوط به جمع آوری، همه چیز را در ادامه مسیر شکل می دهند: هزینه زیرساخت، میزان مواجهه امنیتی، بار نگهداری، اعتماد کاربر، طراحی مدل، و دشواری بازطراحی های بعدی. نهادهایی مانند ICO بریتانیا و CNIL فرانسه در مورد این اصل صریح بوده اند. حریم خصوصی در طراحی و به صورت پیش فرض یعنی محدود کردن اطلاعات شخصی به آنچه واقعاً لازم است، تعبیه کردن سازوکارهای حفاظتی در سراسر چرخه عمر، و تعیین قواعد عملی برای نگهداری و حذف داده. اما پیامد بازار به همان اندازه پیامد حقوقی اهمیت دارد. محصولاتی که داده کمتری جمع می کنند، اغلب اداره پذیرتر، حکمرانی پذیرتر و قابل اعتمادتر می شوند.

از تیک حقوقی تا تصمیم معماری

الگوی قدیمی آشنا بود. یک تیم ویژگی جدیدی را بر مبنای حداکثر جمع آوری داده طراحی می کرد، چون ذخیره سازی ارزان بود و داشتن اختیار بیشتر برای آینده ارزشمند به نظر می رسید. بازبینی حریم خصوصی بعداً انجام می شد، آن هم اغلب به عنوان یک اقدام دفاعی. حفظ این رویکرد حالا سخت تر شده است. قابلیت های هوش مصنوعی فشار می آورند که مجموعه داده های بزرگ و نامرتب وارد سیستم شوند. رخدادهای امنیتی، جمع آوری بیش از حد را پرهزینه تر می کنند. مشتریان سازمانی هم بیشتر و دقیق تر می پرسند داده کجا نگهداری می شود، چه مدت باقی می ماند، و آیا فروشنده می تواند خویشتنداری در جمع آوری را ثابت کند یا فقط به شکلی مبهم وعده اش را بدهد.

در نتیجه، کمینه سازی به مراحل ابتدایی تر فرایند منتقل می شود. از مدیران محصول، طراحان و تیم های داده خواسته می شود تصمیم بگیرند آیا دقت کامل واقعاً لازم است، آیا می توان از شناسه ها پرهیز کرد، آیا می شود رویدادها را به صورت تجمیعی ثبت کرد، و آیا شخصی سازی می تواند به جای پروفایل های متمرکز، بر سیگنال های فرست پارتی یا پردازش روی دستگاه تکیه کند. این ها انتخاب های طراحی و معماری هستند، نه کاغذبازی بعد از وقوع.

کمتر جمع کنید، اما مفید بمانید

رایج ترین ایراد به کمینه سازی این است که ضد رشد به نظر می رسد. تیم ها نگرانند که اگر داده کمتری جمع کنند، شخصی سازی، آزمایش، انتساب، یا کیفیت مدل را از دست بدهند. گاهی این نگرانی بجاست. اما در بسیاری از موارد، بیشتر از آنکه ناشی از نیاز واقعی محصول باشد، بازتاب پیش فرض های تنبلانه است. خیلی از سرویس ها به تاریخ تولد دقیق نیاز ندارند، وقتی بازه سنی کافی است. خیلی از داشبوردها لازم نیست لاگ خام رویدادها را برای همیشه نگه دارند، وقتی تجمیع های دوره ای به سؤال کسب و کار پاسخ می دهد. خیلی از سیستم های پیشنهاد یا رتبه بندی هم می توانند به جای پرونده های عظیم و بلندمدت، بیشتر بر رفتارهای اخیر کاربر در خود محصول تکیه کنند.

راهنمای CNIL در اینجا به ویژه مفید است، چون به جای موضعی انتزاعی و ضد داده، بر کفایت، ارتباط و ضرورت تأکید می کند. این راهنما همچنین به تکنیک های عملی اشاره می کند: تا جای ممکن از داده های حساس پرهیز کنید، وقتی مقدار دقیق لازم نیست از دقت بکاهید، و از همان ابتدا قواعد نگهداری و حذف را تعریف کنید. این ایده ها مانع اندازه گیری یا شخصی سازی نمی شوند. آن ها تیم ها را مجبور می کنند روشن بگویند کدام سیگنال ها ارزش می سازند و کدام ها فقط ریسک تولید می کنند.

چرا هوش مصنوعی اهمیت موضوع را بیشتر می کند

سیستم های هوش مصنوعی کمینه سازی را فوری تر می کنند، چون تعداد راه هایی را که داده های جمع آوری شده می توانند دوباره استفاده شوند افزایش می دهند. مجموعه داده ای که برای یک هدف عملیاتی جمع شده، ممکن است به سوخت آموزشی وسوسه کننده ای برای هدفی دیگر تبدیل شود. این وضعیت هم پیچیدگی حکمرانی ایجاد می کند و هم برای اعتماد کاربر خطرساز است. اگر تیم های محصول نتوانند به روشنی توضیح دهند چرا قطعه ای از داده جمع شده، چگونه تبدیل می شود، و چه زمانی حذف می شود، احتمال بسیار بیشتری دارد که به سمت استفاده ثانویه ای بلغزند که مشتریان را غافلگیر یا ناظران را نگران می کند.

کمینه سازی کمک می کند پیش از آنکه مشکلی رخ دهد، دامنه آسیب محدود شود. داده شخصی خام کمتر یعنی فیلدهای حساس کمتری وارد پرامپت ها، لاگ های مدل، جدول های تحلیلی و یکپارچه سازی های فروشندگان می شود. همچنین فهم رضایت و افشا را ساده تر می کند. هرچه نقشه داده ساده تر باشد، ساختن هوش مصنوعی مسئولانه آسان تر است. از این منظر، کمینه سازی ترمز محصولات هوش مصنوعی نیست. بخشی از صفحه کنترل آن هاست که امکان حکمرانی بر آن ها را حفظ می کند.

اعتماد و تدارکات حالا خروجی محصول هستند

ICO اشاره کرده که حریم خصوصی در طراحی می تواند هزینه بازطراحی های بعدی را کاهش دهد، اعتماد بسازد و به فرایندهای خریدِ مقررات محور کمک کند. این ها مزیت های جانبی نیستند. این ها خروجی های راهبردی اند. در بسیاری از بازارها، به ویژه در خریدهای سازمانی و بخش عمومی، توانایی نشان دادن جمع آوری منضبط، نگهداری محدود و مسیرهای حذف می تواند تعیین کند یک قرارداد بسته می شود یا نه. خریداران روزبه روز بیشتر می خواهند ببینند فروشندگان با داده شخصی مثل یک ماده خام نامحدود رفتار نمی کنند.

مصرف کنندگان شاید اطلاعیه های حریم خصوصی را با دقت نخوانند، اما متوجه می شوند که آیا یک محصول متناسب و معقول به نظر می رسد یا نه. سرویسی که مجوزهای کمتری می خواهد، نیازهایش را شفاف توضیح می دهد و کنترل های واضحی ارائه می کند، می تواند سیگنال اعتماد قوی تری ایجاد کند تا محصولی که وعده شخصی سازی می دهد اما هر داده ممکنی را جارو می کند. در طول زمان، خویشتنداری می تواند بخشی از کیفیت برند شود.

این بده بستان ها واقعی هستند

هیچ کدام از این ها انتخاب های دشوار را حذف نمی کند. داده کمتر می تواند به معنای انعطاف کمتر برای تحلیل های آینده باشد. ورودی های درشت تر ممکن است بعضی مدل ها را ضعیف کنند. نگهداری کوتاه تر می تواند بررسی تقلب یا پژوهش های طولی را پیچیده تر کند. ممکن است تیم ها ناچار شوند روش های آزمایش بهتر، شِماهای دقیق تر، یا طراحی قوی تر رویدادهای فرست پارتی بسازند تا عادتِ جمع کردن همه چیز و تصمیم گیری بعدی را کنار بگذارند.

اما این بده بستان ها اغلب سالم تر از چیزی هستند که در نگاه اول به نظر می رسد. کمیابی، فکر کردن دقیق تر درباره محصول را تحمیل می کند. اگر تیمی مجبور باشد هر فیلد، هر رویداد و هر دوره نگهداری را توجیه کند، معمولاً سریع تر یاد می گیرد چه چیزی واقعاً اهمیت دارد. این انضباط می تواند هزینه های ذخیره سازی را پایین بیاورد، سربار امنیتی را کاهش دهد، حسابرسی ها را ساده تر کند و طراحی سیستم را تمیزتر سازد. چیزی که در یک جلسه برنامه ریزی شبیه محدودیت به نظر می رسد، می تواند در عملیات به اهرم تبدیل شود.

چطور می توان با داده کمتر شخصی سازی کرد

استراتژی کمینه سازی به معنی ساختن محصولات عمومی و بی تفاوت نیست. یعنی انتخاب سیگنال های محدودتر و زمینه مندتر. نشانه های رفتاری فرست پارتی، بافت در سطح نشست، تحلیل هم گروهی، پردازش روی دستگاه، و سنجه های عملکردی تجمیع شده می توانند بدون نیاز به گراف های هویتی حداکثری، شخصی سازی مفیدی ایجاد کنند. تیم ها همچنین می توانند میان آنچه باید به شکل مداوم دانسته شود و آنچه می توان موقتاً استنباط کرد تفکیک قائل شوند. در بسیاری از موارد، محصول به ربط نیاز دارد، نه به نظارت.

اینجاست که استراتژی خوب محصول اهمیت پیدا می کند. به جای اینکه بپرسیم چطور هر سیگنال ممکن را ثبت کنیم، تیم ها می توانند بپرسند کدام لحظه ها واقعاً از حافظه سود می برند، کدام تصمیم ها به داده فردی نیاز دارند، و کدام را می توان با الگوهای کلی تر پاسخ داد. پاسخ ها اغلب به سیستمی منتهی می شوند که توضیح دادنش برای کاربران آسان تر و دفاع از آن در برابر ناظران ساده تر است.

یک مدل محصول بادوام تر

کمینه سازی داده به یک استراتژی محصول تبدیل می شود، چون محصولات دیجیتال دیگر فقط بر اساس قابلیت ها قضاوت نمی شوند، بلکه انضباط عملیاتی آن ها هم زیر ذره بین است. تصمیم های مربوط به جمع آوری حالا هم زمان بر میزان مواجهه با الزامات انطباق، حکمرانی هوش مصنوعی، موفقیت در خرید، وضعیت امنیتی و اعتماد مشتری اثر می گذارند. همین موضوع، کمینه سازی را به تصمیمی میان وظیفه ای با وزن معماری تبدیل می کند.

قوی ترین محصولات آن هایی نخواهند بود که بیشترین داده را جمع می کنند. آن ها محصولاتی خواهند بود که بتوانند با کمترین داده لازم ارزش خلق کنند، نشان دهند چرا به آن نیاز دارند، و وقتی کارش تمام شد آن را کنار بگذارند. این فقط یک تیک قانونی نیست. این روشی بادوام تر برای ساختن نرم افزار است.

چرا کمینه‌سازی داده به یک استراتژی محصول تبدیل می‌شود، نه فقط یک تیک قانونی