سایه هوش مصنوعی: خطر امنیت داده‌ای که بیشتر شرکت‌ها به آن نپرداخته‌اند

وقتی مهندسان به بردار تهدید تبدیل می‌شوند

در آوریل ۲۰۲۳، سامسونگ کشف کرد که مهندسان بخش نیمه‌هادی آن، کد منبع اختصاصی را مستقیماً در ChatGPT برای اشکال‌زدایی یک برنامه وارد کرده‌اند، یادداشت‌های جلسات داخلی را برای خلاصه‌سازی آپلود کرده‌اند، و مشخصات محرمانه تراشه را برای بررسی خطاها وارد کرده‌اند. داده‌ها بلافاصله بخشی از خط لوله آموزشی OpenAI شدند. سامسونگ با ممنوعیت ChatGPT در دستگاه‌های شرکت پاسخ داد - اما خسارت وارد شده بود. سه حادثه جداگانه در یک ماه، اسرار تجاری را فاش کرد که سال‌ها و صدها میلیون دلار برای توسعه آنها هزینه شده بود.

این یک حمله سایبری پیچیده نبود. از هیچ اکسپلویت zero-day استفاده نشد. هیچ مدرکی دزدیده نشد. کارمندان صرفاً به سراغ مؤثرترین ابزار موجود برای خود رفتند - و آن ابزار به طور تصادفی خارج از محیط امنیت شرکتی قرار داشت.

تعریف سایه هوش مصنوعی

سایه هوش مصنوعی به استفاده از ابزارها، پلتفرم‌ها و خدمات هوش مصنوعی توسط کارمندان بدون اطلاع، تأیید یا نظارت تیم IT یا امنیت اشاره دارد. این تکامل عصر هوش مصنوعی از سایه IT است - استفاده غیرمجاز از نرم‌افزارها و خدمات ابری که بیش از یک دهه است شرکت‌ها را آزار می‌دهد. تفاوت در سرعت و پیامد است: سایه IT ممکن است به معنای استفاده یک کارمند از Dropbox به جای SharePoint باشد. سایه هوش مصنوعی به معنای تغذیه داده‌های محرمانه توسط یک کارمند به سیستمی با سیاست‌های مبهم نگهداری داده، توافق‌نامه‌های آموزشی مدل شخص ثالث و بدون هیچ ردپای حسابرسی است.

ابزارهای سایه هوش مصنوعی شامل چت‌بات‌های LLM مصرف‌کننده (ChatGPT، Claude، Gemini)، دستیاران کدنویسی هوش مصنوعی (GitHub Copilot که خارج از توافق‌نامه‌های سازمانی استفاده می‌شود، Cursor، Tabnine در حساب‌های شخصی)، یادداشت‌برداران و خلاصه‌سازان هوش مصنوعی (Otter.ai، Fireflies.ai)، تولیدکنندگان تصویر و افزونه‌های مرورگر با ویژگی‌های هوش مصنوعی تعبیه‌شده هستند. بسیاری از این ابزارها رایگان یا ارزان، بسیار توانمند هستند و برای دسترسی به آنها فقط به یک آدرس ایمیل نیاز است.

مقیاس مشکل

داده‌های مربوط به پذیرش سایه هوش مصنوعی قابل توجه است. یک تحلیل Cyberhaven در سال ۲۰۲۳ از جریان داده‌های ۱.۶ میلیون کارگر نشان داد که ۱۱٪ از داده‌هایی که کارمندان در ChatGPT وارد می‌کنند، محرمانه طبقه‌بندی می‌شوند. در یک هفته، Cyberhaven ردیابی کرد که ۴.۲٪ از کارگران در شرکت‌های مشتری، داده‌های شرکتی را در ChatGPT وارد می‌کنند - و اکثر این فعالیت در حساب‌های شخصی و خارج از هر توافق‌نامه سازمانی انجام می‌شد. یک نظرسنجی Salesforce نشان داد که ۵۵٪ از کارمندان از ابزارهای هوش مصنوعی استفاده می‌کنند که توسط کارفرمایانشان تأیید نشده است، و از این تعداد، ۴۰٪ گفتند که هرگز به مدیران خود اطلاع نمی‌دهند. تحقیقات IBM در سال ۲۰۲۴ نشان داد که ۹۶٪ از مدیران، هوش مصنوعی را یک اولویت حیاتی می‌دانند، با این حال کمتر از یک سوم سیاست‌های رسمی حاکمیت هوش مصنوعی را مستقر کرده بودند. شکاف بین پذیرش و حاکمیت دقیقاً در جایی که خطر بالاترین است، بیشتر است: در شرکت‌هایی که با داده‌های حساس تنظیم‌شده سروکار دارند.

چه داده‌هایی واقعاً در حال نشت هستند

حوادث سایه هوش مصنوعی محدود به کد منبع نیست. محققان امنیتی و فروشندگان DLP دسته‌های زیر از داده‌های وارد شده به ابزارهای هوش مصنوعی غیرمجاز را مستند کرده‌اند:

کد منبع و مالکیت فکری: توسعه‌دهندگان الگوریتم‌های اختصاصی، کد محصول منتشر نشده و جزئیات معماری سیستم را برای دریافت کمک اشکال‌زدایی یا بررسی کد وارد می‌کنند.
اطلاعات قابل شناسایی شخصی مشتری (PII): کارکنان فروش و پشتیبانی، نام، آدرس ایمیل، شماره تلفن و جزئیات حساب مشتریان را برای نوشتن ایمیل یا خلاصه‌سازی تاریخچه موارد به ابزارهای هوش مصنوعی وارد می‌کنند.
پیش‌بینی‌های مالی و داده‌های ادغام و تملک (M&A): تیم‌های مالی از هوش مصنوعی برای تجزیه و تحلیل صفحات گسترده یا نوشتن ارائه‌های هیئت مدیره استفاده می‌کنند و در این فرآیند داده‌های درآمد منتشر نشده و شرایط معامله را آپلود می‌کنند.
اسناد حقوقی: کارکنان حقوقی داخلی از هوش مصنوعی برای خلاصه‌سازی قراردادها، اسناد دعاوی و پرونده‌های نظارتی استفاده می‌کنند - که اغلب شامل ارتباطات محرمانه است.
سوابق منابع انسانی: تیم‌های منابع انسانی از هوش مصنوعی برای نوشتن بررسی‌های عملکرد و نامه‌های اخراج استفاده می‌کنند و داده‌های حقوق کارمندان، سوابق انضباطی و اطلاعات مربوط به تسهیلات پزشکی را وارد می‌کنند.
اسناد استراتژی داخلی: مدیران از دستیاران نوشتاری هوش مصنوعی برای ویرایش یادداشت‌های استراتژی، نقشه‌های راه محصول و تحلیل‌های رقابتی قبل از تأیید برای انتشار خارجی استفاده می‌کنند.

چرا کارمندان قوانین را نادیده می‌گیرند

سرزنش کارمندان نکته اصلی را از دست می‌دهد. شکاف بهره‌وری بین ابزارهای سازمانی تأیید شده و هوش مصنوعی مصرف‌کننده اغلب بسیار زیاد است. یک کارمند که از GPT-4o برای وظایف استدلال پیچیده یا Claude برای تحلیل اسناد طولانی استفاده می‌کند، ممکن است واقعاً ۲-۳ برابر بیشتر از همکاری که به یک ابزار سازمانی پایه با تأخیر شش ماهه تدارکات محدود شده است، بهره‌ور باشد. وقتی شرکت‌ها ۱۸ ماه طول می‌کشد تا یک ابزار هوش مصنوعی را تأیید کنند، کارمندان تصمیمات خود را می‌گیرند. لیست ابزارهای تأیید شده به محض اینکه با آنچه واقعاً کار می‌کند مطابقت نداشته باشد، بی‌ربط می‌شود.

همچنین یک اثر عادی‌سازی وجود دارد. وقتی یک کارمند می‌بیند که مدیرش از ChatGPT در یک تماس کاری استفاده می‌کند، یا وقتی وبلاگ شرکت به محتوای تولید شده توسط هوش مصنوعی اشاره می‌کند، سیگنال ضمنی این است که استفاده از ابزار هوش مصنوعی قابل قبول است. بدون سیاست‌های روشن و اجرای مداوم، اکثر کارمندان منطقی می‌کنند که کاری که انجام می‌دهند اشکالی ندارد - زیرا راه دیگری برای دانستن ندارند.

چهار بردار تهدید

سایه هوش مصنوعی چهار بردار تهدید امنیتی متمایز ایجاد می‌کند که ابزارهای سنتی DLP و امنیت نقطه پایانی به خوبی قادر به رسیدگی به آنها نیستند:

جذب داده‌های آموزشی: بسیاری از پلتفرم‌های هوش مصنوعی مصرف‌کننده، به ویژه آنهایی که تحت شرایط خدمات رایگان فعالیت می‌کنند، به صراحت حق استفاده از ورودی‌های کاربر برای آموزش یا بهبود مدل‌های خود را محفوظ می‌دارند. داده‌های وارد شده امروز ممکن است بر خروجی‌های مدل برای هزاران کاربر آینده - از جمله رقبا - تأثیر بگذارد.
ذخیره‌سازی داده‌های شخص ثالث: حتی پلتفرم‌هایی که روی داده‌های کاربر آموزش نمی‌بینند، همچنان گزارش‌های مکالمه را در سرورهای خارج از کنترل شرکت ذخیره می‌کنند. این گزارش‌ها تابع وضعیت امنیتی، سابقه نقض و حوزه قضایی قانونی فروشنده هستند.
حملات تزریق پرامپت: عوامل مخرب می‌توانند دستورالعمل‌هایی را در اسناد یا صفحات وب جاسازی کنند که وقتی توسط یک ابزار هوش مصنوعی خلاصه می‌شوند، باعث می‌شوند ابزار داده‌ها را خارج کند، رفتار خود را تغییر دهد یا خروجی‌های گمراه‌کننده تولید کند. یک کارمند که از هوش مصنوعی برای خلاصه‌سازی یک ایمیل فیشینگ استفاده می‌کند، می‌تواند باعث تزریق پرامپت شود که هوش مصنوعی را وادار به ارسال زمینه حساس به یک نقطه پایانی تحت کنترل مهاجم کند.
به خاطر سپردن مدل: تحقیقات نشان داده است که LLMها می‌توانند متن کلمه به کلمه را از داده‌های آموزشی خود به خاطر بسپارند و بازتولید کنند، از جمله اطلاعات حساس. داده‌های وارد شده به مدلی که روی ورودی‌های کاربر آموزش می‌بیند، ممکن است در آینده با پرامپت‌های خصمانه قابل بازیابی باشد.

قرار گرفتن در معرض نظارتی واقعی است، نه نظری

سایه هوش مصنوعی فقط یک خطر امنیتی نیست - بلکه یک بدهی انطباق با دندان‌های نظارتی خاص است. تحت GDPR، انتقال داده‌های شخصی ساکنان اتحادیه اروپا به یک فروشنده هوش مصنوعی مستقر در ایالات متحده بدون حفاظت‌های قراردادی کافی (شرایط قراردادی استاندارد یا قوانین شرکتی الزام‌آور) یک انتقال داده غیرقانونی محسوب می‌شود. جریمه‌ها تا ۴٪ از گردش مالی سالانه جهانی است. تحت HIPAA، وارد کردن اطلاعات سلامت بیمار به یک ابزار هوش مصنوعی که تحت توافق‌نامه همکار تجاری (Business Associate Agreement) پوشش داده نشده است، یک نقض مستقیم HIPAA است - نهاد تحت پوشش، نه فروشنده هوش مصنوعی، مسئولیت را بر عهده دارد. حسابرسان SOC 2 به طور فزاینده‌ای در مورد حاکمیت ابزار هوش مصنوعی به عنوان بخشی از معیارهای خدمات اعتماد در دسترس بودن و محرمانگی سؤال می‌کنند. ISO 27001:2022 به صراحت کنترل‌هایی را در مورد روابط تأمین‌کننده و خدمات ابری اضافه کرده است که به ارزیابی‌های فروشنده هوش مصنوعی گسترش می‌یابد. قانون هوش مصنوعی اتحادیه اروپا، که اکنون در حال اجرا است، الزامات بیشتری را در مورد مستندسازی سیستم‌های هوش مصنوعی پرخطر و نظارت انسانی اضافه می‌کند که استقرارهای سایه‌ای به طور تعریف نمی‌توانند آنها را برآورده کنند.

آنچه تیم‌های امنیتی باید اکنون انجام دهند

ممنوعیت کامل هوش مصنوعی قبلاً بی‌اثر بودن خود را ثابت کرده است - ممنوعیت سامسونگ استفاده را به زیرزمینی سوق داد تا اینکه آن را از بین ببرد. حاکمیت مؤثر سایه هوش مصنوعی به ترکیبی از کنترل‌های فنی، جایگزین‌های تأیید شده و تغییر رفتار نیاز دارد:

استقرار DLP آگاه از هوش مصنوعی: راه‌حل‌های DLP نسل بعدی از فروشندگانی از جمله Nightfall، Cyberhaven و Microsoft Purview اکنون می‌توانند جریان داده‌ها را به طور خاص به نقاط پایانی هوش مصنوعی شناسایی کنند. سیاست‌هایی را برای هشدار یا مسدود کردن آپلود کد منبع، PII و داده‌های مالی به خدمات هوش مصنوعی تأیید نشده پیکربندی کنید.
اجرای کنترل‌های SSE/CASB: پلتفرم‌های Security Service Edge از Netskope، Palo Alto Prisma Access و Zscaler دید را در مورد استفاده از برنامه‌های ابری فراهم می‌کنند و می‌توانند سیاست‌های دقیقی را در مورد دسترسی به ابزار هوش مصنوعی اعمال کنند - به عنوان مثال، مسدود کردن ChatGPT مصرف‌کننده در حالی که یک توافق‌نامه سازمانی OpenAI را مجاز می‌کند.
استقرار پلتفرم‌های هوش مصنوعی سازمانی با تضمین‌های اقامت داده: Microsoft 365 Copilot، Google Workspace Duet AI و AWS Bedrock همگی توافق‌نامه‌های سازمانی با جداسازی داده‌های صریح، عدم آموزش روی داده‌های مشتری و ثبت حسابرسی ارائه می‌دهند. دادن دسترسی به هوش مصنوعی توانمند در یک محیط تحت حاکمیت به کارمندان، مستقیماً انگیزه استفاده سایه‌ای را کاهش می‌دهد.
انجام آموزش کارکنان خاص هوش مصنوعی: برنامه‌های آگاهی امنیتی اکنون باید شامل سناریوهای خاص هوش مصنوعی باشند - چه داده‌هایی را نمی‌توان در ابزارهای هوش مصنوعی وارد کرد، چگونه خدمات هوش مصنوعی غیرمجاز را شناسایی کرد و چگونه حوادث مربوط به هوش مصنوعی را گزارش داد. آموزش عمومی امنیت سایبری کافی نیست.
ایجاد یک فهرست دارایی هوش مصنوعی: قبل از اینکه بتوانید استفاده از هوش مصنوعی را حاکم کنید، باید بدانید چه چیزی در حال استفاده است. ابزارهای CASB می‌توانند این را به صورت غیرفعال آشکار کنند. نظرسنجی‌های فعال و ممیزی‌های هوش مصنوعی در سطح بخش می‌توانند کشف خودکار را تکمیل کنند.

چارچوب حاکمیتی که CISOها به آن نیاز دارند

کنترل‌های فنی به تنهایی بدون ساختار حاکمیتی کافی نیستند. CISOها باید در ۹۰ روز آینده سه مورد قابل تحویل حاکمیتی خاص را هدایت کنند:

سیاست استفاده قابل قبول از هوش مصنوعی: یک سند سیاست مستقل - متمایز از سیاست استفاده قابل قبول عمومی IT - که ابزارهای هوش مصنوعی تأیید شده، موارد استفاده ممنوع (وارد کردن PII، کد منبع، محتوای محرمانه وکیل-موکل)، قوانین دستگاه شخصی و عواقب انضباطی برای تخلفات را تعریف می‌کند. این سیاست باید امضا و تأیید شود، نه فقط منتشر شود.
لیست ابزارهای هوش مصنوعی تأیید شده: یک ثبت‌نام که به طور منظم به‌روزرسانی می‌شود از ابزارهای هوش مصنوعی تأیید شده برای استفاده شرکتی، با دستورالعمل‌های مربوط به مدیریت داده برای هر یک. این لیست باید بین ابزارهای تأیید شده برای استفاده عمومی، ابزارهای تأیید شده فقط برای داده‌های غیرحساس و ابزارهایی که به صراحت ممنوع هستند، تمایز قائل شود.
ادغام طبقه‌بندی داده: حاکمیت هوش مصنوعی بدون طبقه‌بندی داده نمی‌تواند کار کند. اگر کارمندان ندانند چه داده‌هایی محرمانه است، نمی‌توانند تصمیمات خوبی در مورد اینکه چه چیزی را در ابزارهای هوش مصنوعی وارد کنند، بگیرند. محدودیت‌های استفاده از هوش مصنوعی را مستقیماً در آموزش طبقه‌بندی داده و سیاست‌های DLP مبتنی بر برچسب ادغام کنید.

اقدامات فوری برای CISOها

حادثه سامسونگ در سال ۲۰۲۳ رخ داد. از آن زمان، ابزارها فقط توانمندتر، در دسترس‌تر و عمیق‌تر در جریان‌های کاری کارمندان تعبیه شده‌اند. CISOهایی که هنوز در مورد سایه هوش مصنوعی اقدامی نکرده‌اند، باید موارد زیر را اولویت‌بندی کنند: این هفته یک پرس‌وجوی CASB یا SSE اجرا کنید تا مشخص شود کارمندان شما واقعاً از چه خدمات هوش مصنوعی استفاده می‌کنند. آن لیست را با ثبت ابزارهای تأیید شده خود مقایسه کنید. برای هر سرویس تأیید نشده با استفاده قابل توجه، تعیین کنید که آیا می‌توان آن را با یک معادل سازمانی تأیید شده جایگزین کرد - و اگر چنین است، تدارکات را تسریع کنید. یک اطلاعیه موقت صادر کنید که استفاده از ابزار هوش مصنوعی را تأیید می‌کند، انتظارات روشنی را تعیین می‌کند و کانالی را برای کارمندان باز می‌کند تا تأیید ابزار را درخواست کنند به جای اینکه از فرآیند دور بزنند. هدف حذف استفاده از هوش مصنوعی نیست. هدف این است که اطمینان حاصل شود که وقتی کارمندان به سراغ هوش مصنوعی می‌روند - و خواهند رفت - به سراغ ابزارهایی می‌روند که داده‌های شرکت را در معرض خطر غیرقابل قبول قرار ندهند.