블로그 | CTO 사무실

생성 AI의 보안 및 신뢰성을 위한 솔루션

로리 맥비티 썸네일
로리 맥비티
2023년 11월 28일 게시

모두가 생성 AI라는 금광으로 달려들고 있습니다. 적어도 표면적으로는 그렇게 보입니다. 요즘 제 편지함에 들어오는 보도자료 중에 생성 AI에 대해 어떤 식으로든 언급하지 않은 것이 거의 없습니다.

하지만 좀 더 깊이 파고들면 현재 생성적 AI가 가장 큰 영향을 미치고 있는 분야가 마케팅이라는 사실을 금방 알 수 있습니다.

지금 우리가 보고 있는 것은 사람들이 낮게 달린 과일을 낚아채는 모습입니다. 상당한 개발이나 연구 없이도 "볼트 장착"이 쉬운 기능은 모두 슈퍼 접착제로 붙여서 출시됩니다.

기술, 제조, 의료 분야 등 대부분의 회사는 보다 신중한 접근 방식을 취하고 있습니다. 좀 더 전략적인 접근 방식이라고 말씀드릴 수 있겠습니다. 그리고 이것은 제 블로그이기에 가능합니다.

최근 ExtraHop 설문 조사를 통해 인지도를 판단해보면, 생성 AI를 사용하는 방법에 대해 더욱 비판적인 이유는 잘 알려져 있습니다. 가장 큰 우려 사항은 신뢰성과 보안이라는 두 가지 측면으로 나뉩니다.

생성적 AI 차트를 사용하는 데 있어 가장 큰 우려 사항은 다음과 같습니다.

생성 AI 분야에서 신뢰성은 정확성과 신뢰에 관한 것입니다. 코드, 구성, 콘텐츠 등 내가 받는 응답은 정확하고 올바르며 편견이 가득하지 않다는 것을 믿을 수 있어야 합니다.

보안 분야에서 우리는 항상 그래왔듯이, 그 이상의 우려를 갖고 있습니다. 이제는 고객 및 직원의 PII가 노출되는 것뿐만 아니라 영업 비밀과 지적 재산이 널리 전 세계로 유출되는 문제도 있습니다. 

생성적 AI 위험 해결

신뢰성 있게 문제를 해결하려면 많은 노력이 필요합니다. 왜냐하면 (a) 많은 교육과 미세 조정이 필요하거나 (b) 생성 AI가 솔루션의 일부일 뿐이고 고급 신속한 엔지니어링 기술을 활용하여 자체 응답을 검증하는 아키텍처적 접근 방식이 필요하기 때문입니다. 두 가지 모두 시간과 비용이 필요하기 때문에 생성적 AI 솔루션이 시장을 형성하지 못하는 것입니다. 아직. 그럴 것은 분명하지만, 시간이 걸릴 거예요. 

보안 문제는 해결하기가 더 쉽기도 하고 어렵기도 합니다. 무역 비밀이나 지적 재산권 노출 문제를 해결하려면 (a) LLM의 자체 인스턴스를 배포하고 운영(및 이와 관련된 모든 작업)하거나 (b) 문제를 해결하기 위한 아키텍처를 구축해야 합니다. 이는 LLM의 생성 기능을 기본 소스가 아닌 도구로 사용하는 GPT 에이전트를 개발하는 것을 의미합니다. 

예를 들어, 수집한 데이터가 전략적으로 중요할 수 있다는 사실을 잊기 쉽습니다. 제가 시장 활동을 추적하는 데 사용하는 모델은 무해해 보일 수 있지만 F5가 시장에 대해 어떻게 생각하고 그 시장에서 경쟁하기 위해 어떻게 계획하는지에 대한 많은 정보를 보여줍니다. 전략적 의미가 있습니다. 그러므로 이는 분석을 위해 공개 LLM에 넘겨주고 싶은 것이 아닙니다. 생성 AI가 표 형식 데이터를 분석하는 데 끔찍하다는 현실을 추가하면 이는 나쁜 사용 사례처럼 보입니다. 

하지만 OpenAI의 기능을 활용 해 Python의 데이터 분석 기능을 활용하는 건 전혀 나쁜 생각이 아닙니다. 이렇게 하려면 OpenAI에 데이터를 넘겨 분석하는 대신 GPT 에이전트를 구축해야 하므로 시간과 개발 노력이 필요하지만, 안정성과 보안이라는 과제를 모두 해결합니다. 

고객이나 직원의 개인식별정보가 실수로 노출되는 경우, 데이터 마스킹이라는 더 쉬운 해결책이 이미 나오고 있습니다.

생성 AI를 위한 데이터 마스킹

이제 데이터 마스킹이 개발에 널리 사용되면서 개발자가 민감한 데이터를 노출할 위험 없이 실제 데이터로 테스트할 수 있게 되었습니다. 하지만 이는 노출을 방지하는 방법으로 생성 AI에 사용하는 데에도 동일하게 적용할 수 있습니다. 이미 여러 오픈소스 라이브러리와 도구가 제공되어 통합하기 쉽습니다. 대부분의 생성 AI는 API 기반이고 API는 민감한 데이터에 대한 요청을 쉽게 가로채서 검사할 수 있기 때문입니다. 

데이터 마스킹을 사용하여 생성적 AI 보안 문제를 해결하는 것은 개발과 운영 모두에서 효과적이며, 애플리케이션 수명 주기 전반에 걸쳐 중요한 데이터가 노출되지 않도록 보장합니다. 

생성 AI가 등장하여 다른 모든 기술을 제치고 선두를 차지하기 전에도 데이터 마스킹이 증가하고 있었던 것은 분명합니다. 그러나 생성적 AI는 앱 개발뿐 아니라 애플리케이션 제공 및 보안 도메인 내에서 데이터 마스킹 기능을 위한 촉진제 역할을 할 가능성이 높습니다.

F5 솔루션이 AI 기반 앱을 구동하고 보호하는 방식 보기 ›