구글은 EVE 온라인에 AI를 테스트하기 위해 파트너십을 맺었습니다.
구글 딥마인드는 EVE 온라인에서 AI 모델을 테스트합니다.
구글 딥마인드는 CCP 게임즈와 파트너십을 맺어 EVE 온라인의 가상 우주에서 AI 모델을 테스트합니다. CCP 게임즈는 1200만 달러의 자금과 재개장 후에 FenrisCreation으로의 변화를 겪었습니다. 이 협력은 EVE 온라인의 지속적인 라이브 환경을 이용하여 플레이어 주도적인 복잡한 조건에서 AI 행동을 평가하는 것을 목표로 합니다. 테스트에는 自動 에이전트 상호 작용 및 16년 된 사인드 보드에서 800,000 명의 등록 된 사용자가 있는 환경에서 결정을 내리는 것입니다.
EVE 온라인의 생태계는 플레이어 경제, 영토적인 충돌 및 발화하는 시스템으로 인해 AI를 위한 유니크한 실험실을 제공합니다. 게임의 물리 엔진 및 경제 모델은 AI 시스템에게 불량한 도전을 제공합니다. Fenris Creation CEO Hilmar Pétursson은 파트너십이 강화 학습 기술에 초점을 맞출 것이라고 확인했지만 구체적인 기술 기준을 공개하지 않았습니다.
AI 검색은 Reddit에 전문가 조언을 통합했습니다.
구글은 SGE AI 검색을 업데이트하여 Reddit에서 “Expert Advice”를 가져와 기존의 소스들인 위키백과와 유튜브를 넘어했습니다. 이 기능은 소프트웨어 개발에 대한 기술적인 질문에 대한 관련된 Reddit 주제를 표면화합니다. 사용자들은 Reddit Premium 계정을 보유한 경우 검증된 콘텐츠에 대한 우선 액세스를 즐기며, Reddit의 커뮤니티 주도된 콘텐츠 모델은 정보 유포에 대한 내재된 위험이 있습니다.
Reddit 통합은 Stack Overflow와 전문적인 포럼과 함께 수개월 동안 테스팅을 거쳤습니다. 구글의 알고리즘은 자연어 처리를 사용하여 질의 목적을 서브레딧 도메인으로 매핑합니다. 초기 테스트 결과는 일반적인 웹 결과와 비교하여 37%의 정확한 기술적 대답을 보여주었습니다. 그러나 Reddit 커뮤니티가 충돌하는 정보를 가지고 있는 문맥 상위적 토픽에 대한 시스템은 어려움을 겪습니다.
오픈 소스 도구는 Google 시트와 LLM을 연결합니다.
AISheeter라는 오픈 소스 확장을 사용하면 사용자는 Google Sheet와 LLM을 연결할 수 있습니다. 이 도구는 GPT-5.4, Claude Sonnet 4.5, Gemini 2.5 및 Groq 모델을 지원하며 자체 수정하는 수식, 진보적이 되는 사유 공개, 그리고 세션 기억 학습과 같은 특징들을 포함합니다. 개발자는 자연어 지시와 사용하여 감정 분석, 특징 추출 및 급한 우선순위 지정과 같은 태스크를 자동화할 수 있습니다.
이 도구의 아키텍처는 에러를 검출하고 실행하기 전에 카OLUMN 참조와 논리적 매개 변수를 검사하는 에이블러-옵티마이저 패턴을 포함합니다. 성능 테스트에서 캐시된 작업에 대해 10ms의 지연이 있습니다. 도구의 투명성 특징은 사용자가 최종 출력 전에 모델의 사유 과정을 확인할 수 있도록 합니다. 복잡한 금융 모델링에 대한 AI 생성된 수식의 수동 검증이 필요하지만 구조화된 데이터 작업에 대해서는 잘 작동합니다.
피닉스 SaaS 템플릿이 인기를 얻고 있습니다.
인디 개발자 중간에 모듈식 피닉스에 기반한 SaaS 시작 키트가 인기를 얻고 있습니다. 이 템플릿에는 인증, 지불, AI 통합과 같은 미리 빌드된 컴포넌트가 포함되어 있습니다. 템플릿은 프로덕션 준비된 스트립과 레몬스퀘지 지불 시스템을 포함하고 있습니다. 개발자는 Fly.io에 배포하고 자동 스케일링과 도커 지원을 통해 5분 이내에 배포할 수 있습니다.
템플릿의 AI 레이어는 여러 제공자와 오류를 참조하는 처리 및 zero-shot 지시 처리를 지원합니다. 테스팅은 보일러 플레이트 코드의 40%를 감소시킨다는 것을 보여주었습니다. 그러나 프레임워크의 Erlang 의존성은 기능적 프로그래밍에 익숙하지 않은 팀에 대한 학습 곡선을 유발합니다. 초기 채택자는 초기 설정에서 시간을 절약하지만 템플릿의 범위 밖에서 커스텀화를 필요로 하는 유지보수에 계속 유지 보수합니다.
업계 배경과 기술 제한.
딥마인드 - EVE 협력은 AI 실험실이 제어된 유동적인 환경에서 훈련을하기 위해 추구하는 더 넓은 트렌드에 반영됩니다. 게임 회사인 유비소프트와 에픽 게임즈는 비슷한 파트너십을 AI 연구자와 맺었지만 CCP의 재개장과 Fenris Creation으로의 변화를 통한 전략적 회전으로는 다릅니다. 기술적 도전은 게임 밸런스를 유지하면서 실험적 AI 시스템을 테스트하는 것입니다.
현재 AI 검색 통합은 플랫폼에 의존하는 편견에 의해 제한됩니다. Reddit의 커뮤니티 주도된 콘텐츠 모델은 정보 유포에 대한 내재된 위험이 있습니다. 시트 확장의 오픈 소스성은 커뮤니티 개선에 허용하지만 엔터프라이즈급 보안 인증서가 없습니다. meanwhile, 피닉스 SaaS 템플릿의 모듈식 설계는 컴포넌트들 사이의 의존성에 대해 개발자가 관리해야 하는 것을 요구하기 때문에 통합 복잡성을 유발합니다.
무엇을 보아야 합니까.
Fenris Creation은 EVE 온라인 AI 테스트의 베타 결과를 Q4 2024에 발표할 계획입니다. 구글의 SGE 팀은 Reddit 통합 성능을 전통적인 검색 결과와 비교하여 미래의 벤치마크에서 측정할 것입니다. AISheeter 개발자는 중간 2024에 다중 모델 앙상블 능력을 추가할 예정입니다. 피닉스 SaaS 템플릿의 창조자는 Elixir에 대한 AI 최적화를 위해 Tidewave MCP 런타임 분석 도구를 사용할 예정입니다.