Apple은 현재 AI 게임에서 최고의 플레이어 중 하나는 아니지만 사진 편집을 위한 회사의 새로운 오픈 소스 AI 모델은 해당 분야에 어떤 기여를 할 수 있는지 보여줍니다. 이 모델은 MGIE(MLLM 유도 이미지 편집)라고 하며, MLLM(다중 모드 대형 언어 모델)을 사용하여 이미지를 처리할 때 텍스트 기반 명령을 해석합니다. 즉, 이 도구에는 사용자가 입력하는 텍스트를 기반으로 이미지를 편집하는 기능이 있습니다. 이를 수행할 수 있는 최초의 도구는 아니지만 “인간의 지시는 때로는 기존 방법으로 캡처하고 따르기에는 너무 짧습니다.” 프로젝트 시트 (PDF) 읽어보세요.

이 회사는 캘리포니아 대학교 산타바바라 캠퍼스의 연구원들과 함께 MGIE를 개발했습니다. MLLM은 단순하거나 모호한 텍스트 프롬프트를 이미지 편집기가 직접 따를 수 있는 보다 자세하고 명확한 지침으로 바꾸는 기능을 갖추고 있습니다. 예를 들어, 사용자가 페퍼로니 피자의 이미지를 “건강하게 만들기” 위해 편집하려는 경우 MLLM은 이를 “야채 토핑 추가”로 해석하고 이미지를 편집할 수 있습니다.

피자, 치타, 컴퓨터 및 사람들의 사진.피자, 치타, 컴퓨터 및 사람들의 사진.

사과

MGIE는 이미지를 크게 변경하는 것 외에도 텍스트 프롬프트를 통해 이미지 자르기, 크기 조정 및 회전은 물론 밝기, 대비 및 색상 균형을 향상시킬 수도 있습니다. 또한 이미지의 특정 영역을 수정할 수 있으며, 예를 들어 사진 속 사람의 머리카락, 눈, 옷을 수정하거나 배경의 개체를 제거할 수 있습니다.

좋다 벤처비트 Notes, Apple을 통해 모델 출시 깃허브하지만 관심 있는 사람들은 다음을 시도해 볼 수도 있습니다. 실험적인 현재 Hugging Face Spaces에서 호스팅되고 있습니다. Apple은 이 프로젝트에서 배운 내용을 자사 제품에 통합할 수 있는 도구나 기능에 사용할 계획인지 아직 명확하게 밝히지 않았습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

Google의 분할 화면 Android Auto 개편이 시작됩니다.

새로운 Android Auto는 매우 유연합니다. 이것은 큰 화면 모드입니다. 구글 울트라 와이드…

Best Buy는 PS5 및 Xbox를 복원하지만 몇 분 안에 매진되었습니다.

Esports 호스트 인 Kate Bedford는 Playstation 5, Xbox Series X에 대한 수요가…

Palworld 플레이어는 삶의 질에 있어 “중요한” 변화를 요구합니다.

로리 틸 ❘ 출판됨: 2024-02-11T16:25:10 ❘ 업데이트됨: 2024-02-11T16:25:21 Palworld 플레이어들은 개발자 Pocketpair가…

해커가 Sonic 및 Mario Kart 64와 같은 불법 게임으로 Microsoft Edge를 넘치고 있습니다.

Microsoft Edge 확장 저장소는 다음과 같은 여러 인기 게임의 불법 복사본을 호스팅하는…