OpenAI bổ sung tùy chọn bảo mật mới cho ChatGPT với việc triển khai Chế độ khóa hoặc Chế độ khóa bằng tiếng Anh. Tính năng này nhằm mục đích bảo vệ tốt hơn những người dùng dễ gặp phải nhất trước một rủi ro phổ biến trong lĩnh vực trí tuệ nhân tạo tổng hợp: đánh cắp dữ liệu do các cuộc tấn công tiêm nhiễm kịp thời.
Cụ thể, chế độ này giới hạn quyền truy cập của ChatGPT vào Web, các dịch vụ bên ngoài và một số chức năng nâng cao nhất định nhằm giảm khả năng rò rỉ thông tin nhạy cảm. Đây không phải là cài đặt bảo mật đơn giản mà là cơ chế bảo mật chặt chẽ hơn, được thiết kế để sử dụng trong đó các cuộc hội thoại có thể chứa tài liệu bí mật, dữ liệu chuyên môn, thông tin nội bộ hoặc vật dụng cá nhân có giá trị cao.
Chế độ khóa để giảm thiểu rủi ro liên quan đến việc tiêm nhanh
Việc tiêm nhắc nhở là một trong những mối đe dọa cụ thể nhất đối với các mô hình ngôn ngữ lớn. Nguyên tắc này bao gồm việc ẩn các hướng dẫn độc hại trong nội dung mà AI bắt buộc phải đọc: trang web, tệp, tài liệu được chia sẻ, email hoặc thậm chí là tài nguyên được sử dụng bởi một công cụ được kết nối. Sau đó, trợ lý có thể được khuyến khích bỏ qua một số hướng dẫn nhất định, sửa đổi hành vi của mình hoặc, trong những trường hợp nhạy cảm nhất, cố gắng truyền thông tin ra bên ngoài cuộc trò chuyện.
Rủi ro này trở nên nghiêm trọng hơn khi ChatGPT có được khả năng. Dịch vụ này không còn bị giới hạn trong việc trả lời các câu hỏi: nó có thể phân tích tệp, duyệt Internet, sử dụng trình kết nối, thực hiện một số tác vụ nhất định hoặc dựa vào các công cụ bên ngoài. Những tính năng này làm cho trợ lý trở nên hữu ích hơn nhưng chúng cũng làm tăng khả năng bị tấn công.
Do đó, chế độ khóa của OpenAI tìm cách giảm các kênh mà dữ liệu nhạy cảm có thể thoát ra ngoài. Theo tài liệu OpenAI chính thức dành riêng cho Chế độ khóa, tùy chọn này hạn chế nhiều khả năng truy cập vào mạng nhằm hạn chế nguy cơ rò rỉ dữ liệu liên quan đến việc tiêm nhắc nhở.
ChatGPT vô hiệu hóa gì với chế độ khóa
Sau khi được kích hoạt, chế độ khóa sẽ sửa đổi sâu sắc hoạt động của ChatGPT. Duyệt web trực tiếp bị hạn chế: trợ lý không còn có thể tự do truy cập nội dung trong thời gian thực và bị giới hạn ở thông tin được lưu trong bộ nhớ đệm khi khả năng này vẫn khả dụng. Hạn chế này có thể làm cho một số phản hồi nhất định trở nên kém mới mẻ hoặc kém hoàn thiện hơn, nhưng trên hết nó ngăn cản việc điều hướng được sử dụng làm kênh truyền tải cho bên thứ ba.
Hỗ trợ hình ảnh từ web cũng bị hạn chế. ChatGPT không thể tích hợp hoặc hiển thị một số hình ảnh nhất định từ Internet trong phản hồi của nó nữa. Tuy nhiên, người dùng có thể tiếp tục nhập tệp hình ảnh của riêng mình và sử dụng khả năng tạo hình ảnh khi có sẵn. Ở đây một lần nữa, mục tiêu là ngăn chặn việc sử dụng tài nguyên từ xa để kích hoạt yêu cầu bên ngoài hoặc truyền thông tin gián tiếp.
OpenAI cũng vô hiệu hóa tìm kiếm sâu, một tính năng dựa vào việc khai thác các nguồn bên ngoài để tạo ra câu trả lời sáng suốt hơn. Chế độ đại lý cũng bị ảnh hưởng. Hạn chế này là hợp lý: một tác nhân có khả năng thực hiện các hành động tự chủ, dịch vụ tư vấn hoặc tương tác với các công cụ được kết nối sẽ có nguy cơ cao hơn khi xử lý nội dung có khả năng bị mắc kẹt.
Canvas, tệp và công cụ được kết nối cũng bị ảnh hưởng
Bảo vệ không dừng lại ở các chức năng dễ thấy nhất. Chế độ khóa cũng ngăn người dùng cho phép mã được tạo trong Canvas truy cập mạng. Việc làm rõ này sẽ được các hồ sơ kỹ thuật đặc biệt quan tâm, vì quyền truy cập mạng của mã được tạo có thể tạo thành đường dẫn rò rỉ nếu một lệnh độc hại tìm cách ảnh hưởng đến hành vi của trợ lý.
Một hạn chế quan trọng khác: ChatGPT không thể tự tải tệp lên để phân tích dữ liệu trong bối cảnh này. Mặt khác, người dùng luôn có thể nhập thủ công các tệp của riêng họ để phân tích. Sự khác biệt này rất cần thiết: OpenAI không chặn công việc xử lý tài liệu nhưng hạn chế các hành động gửi đi hoặc tự động có thể làm lộ thông tin nhạy cảm.
Các đầu nối, ứng dụng và tích hợp bên ngoài cũng được đề cập. Những công cụ này có thể tương tác với Internet hoặc với các dịch vụ của bên thứ ba, khiến chúng có khả năng bị khai thác trong các tình huống tấn công tinh vi. Trong môi trường doanh nghiệp, hành vi của họ có thể phụ thuộc vào cài đặt do quản trị viên đặt, bao gồm các quyền kiểm soát quyền truy cập và vai trò được chỉ định cho người dùng.
Một công cụ được thiết kế cho hồ sơ có rủi ro cao
OpenAI không hiển thị chế độ này như một tùy chọn cần thiết cho tất cả người dùng. Chế độ khóa chủ yếu nhắm vào những người và tổ chức thường xuyên xử lý dữ liệu nhạy cảm hoặc những người có thể là mục tiêu tấn công nhiều hơn: người quản lý, nhóm an ninh mạng, nhân viên của các công ty bị lộ, nhà báo làm việc về các chủ đề bí mật, luật sư, nhà nghiên cứu, lãnh đạo chính trị hoặc nhân viên có quyền truy cập vào các tài liệu chiến lược.
Đối với việc sử dụng ChatGPT hàng ngày, chế độ này có thể được coi là quá hạn chế. Nó làm giảm quyền truy cập vào một số tính năng phổ biến, bao gồm tìm kiếm trên web, tìm kiếm sâu và khả năng tác nhân. Đổi lại, nó mang lại một môi trường khép kín hơn, dễ dự đoán hơn và ít phụ thuộc hơn vào các kết nối bên ngoài.
Tăng cường an ninh nhưng chưa bảo vệ tuyệt đối
OpenAI nhấn mạnh một điểm quan trọng: chế độ khóa không loại bỏ tất cả các hình thức nhắc nhở. Lệnh độc hại có thể vẫn còn tồn tại trong tệp đã nhập hoặc nội dung được lưu trong bộ nhớ đệm. Nó vẫn có thể làm gián đoạn phản hồi, hướng dẫn phân tích hoặc cố gắng tác động đến lý luận của trợ lý.
Sự khác biệt chủ yếu nằm ở những hậu quả có thể xảy ra. Bằng cách giới hạn khả năng mạng, hình ảnh từ web, tìm kiếm sâu, chế độ Tác nhân hoặc một số hành động tự động nhất định, OpenAI giảm đường dẫn cho dữ liệu bí mật rời khỏi môi trường hội thoại. Do đó, chế độ khóa phải được hiểu là một rào cản bổ sung chứ không phải là sự đảm bảo tuyệt đối trước mọi rủi ro.
Chế độ khóa nào không thay đổi
Không nên nhầm lẫn chế độ khóa với chế độ riêng tư toàn cầu. Nó không tự động thay đổi cài đặt liên quan đến bộ nhớ, chia sẻ cuộc hội thoại hoặc có khả năng sử dụng cuộc hội thoại để cải thiện mô hình. Các cài đặt này vẫn riêng biệt và phải được kiểm soát trong cài đặt dữ liệu hoặc, trong trường hợp là không gian làm việc, bởi quản trị viên.
Sắc thái này rất quan trọng đối với những người dùng muốn bảo vệ thông tin của họ. Việc bật chế độ khóa sẽ giảm một số tương tác với thế giới bên ngoài nhưng không thay thế cấu hình tốt của các tùy chọn quyền riêng tư. Do đó, bạn vẫn nên kiểm tra cài đặt bộ nhớ, kiểm soát dữ liệu, quyền của trình kết nối và các quy tắc được áp dụng trong không gian chuyên nghiệp.
OpenAI cũng cho phép bạn tắt chế độ khóa cho một cuộc trò chuyện cụ thể. Tính linh hoạt này có thể hữu ích khi người dùng tạm thời cần các chức năng bị chặn, chẳng hạn như duyệt web trực tiếp hoặc tìm kiếm sâu. Tuy nhiên, phải lưu ý rằng việc tắt tính năng bảo vệ này sẽ khôi phục các khả năng bên ngoài của ChatGPT và tăng khả năng gặp rủi ro một cách máy móc mà chế độ này tìm cách hạn chế.
Phản hồi về sự phát triển của ChatGPT theo hướng sử dụng chuyên nghiệp hơn
Sự xuất hiện của chế độ này minh họa cho sự phát triển nhanh chóng của ChatGPT. Dịch vụ này không còn chỉ là một chatbot công cộng có khả năng viết văn bản hoặc trả lời câu hỏi. Nó đang dần trở thành một giao diện làm việc được kết nối với các tài liệu, công cụ, ứng dụng và luồng thông tin. Sự chuyển đổi này áp đặt các biện pháp bảo vệ mới.
Trợ lý AI càng tự chủ thì việc quản lý quyền càng tập trung hơn. Thách thức đối với OpenAI là duy trì tính hữu ích của ChatGPT đồng thời ngăn chặn nội dung độc hại chiếm đoạt khả năng của nó. Chế độ khóa cung cấp một giải pháp thực tế cho vấn đề này: giảm các chức năng dễ bị lộ nhất khi ngữ cảnh yêu cầu.
Cách tiếp cận này sẽ được các công ty, cơ quan quản lý và người dùng chuyên nghiệp quan tâm, những người muốn quản lý chặt chẽ hơn việc sử dụng AI tổng hợp. Nó cũng nhắc nhở chúng ta rằng bảo mật không chỉ phụ thuộc vào bản thân mô hình mà còn phụ thuộc vào toàn bộ hệ sinh thái xung quanh nó: các công cụ được kết nối, duyệt web, quyền truy cập vào tệp, quyền, vai trò quản trị viên và chính sách nội bộ.
Do đó, với chế độ khóa, OpenAI bổ sung thêm tính năng bảo vệ đáng hoan nghênh đối với những mục đích sử dụng ChatGPT nhạy cảm. Chức năng này đặt ra những thỏa hiệp thực sự về sự thoải mái và sức mạnh, nhưng nó đáp ứng một vấn đề cơ bản: cho phép AI tổng hợp vẫn hữu ích trong những môi trường mà việc bảo mật dữ liệu không thể được coi là một lựa chọn đơn giản.

















