Apple은 현재 AI 게임에서 최고의 플레이어 중 하나는 아니지만 사진 편집을 위한 회사의 새로운 오픈 소스 AI 모델은 해당 분야에 어떤 기여를 할 수 있는지 보여줍니다. 이 모델은 MGIE(MLLM 유도 이미지 편집)라고 하며, MLLM(다중 모드 대형 언어 모델)을 사용하여 이미지를 처리할 때 텍스트 기반 명령을 해석합니다. 즉, 이 도구에는 사용자가 입력하는 텍스트를 기반으로 이미지를 편집하는 기능이 있습니다. 이를 수행할 수 있는 최초의 도구는 아니지만 “인간의 지시는 때로는 기존 방법으로 캡처하고 따르기에는 너무 짧습니다.” 프로젝트 시트 (PDF) 읽어보세요.

이 회사는 캘리포니아 대학교 산타바바라 캠퍼스의 연구원들과 함께 MGIE를 개발했습니다. MLLM은 단순하거나 모호한 텍스트 프롬프트를 이미지 편집기가 직접 따를 수 있는 보다 자세하고 명확한 지침으로 바꾸는 기능을 갖추고 있습니다. 예를 들어, 사용자가 페퍼로니 피자의 이미지를 “건강하게 만들기” 위해 편집하려는 경우 MLLM은 이를 “야채 토핑 추가”로 해석하고 이미지를 편집할 수 있습니다.

피자, 치타, 컴퓨터 및 사람들의 사진.피자, 치타, 컴퓨터 및 사람들의 사진.

사과

MGIE는 이미지를 크게 변경하는 것 외에도 텍스트 프롬프트를 통해 이미지 자르기, 크기 조정 및 회전은 물론 밝기, 대비 및 색상 균형을 향상시킬 수도 있습니다. 또한 이미지의 특정 영역을 수정할 수 있으며, 예를 들어 사진 속 사람의 머리카락, 눈, 옷을 수정하거나 배경의 개체를 제거할 수 있습니다.

좋다 벤처비트 Notes, Apple을 통해 모델 출시 깃허브하지만 관심 있는 사람들은 다음을 시도해 볼 수도 있습니다. 실험적인 현재 Hugging Face Spaces에서 호스팅되고 있습니다. Apple은 이 프로젝트에서 배운 내용을 자사 제품에 통합할 수 있는 도구나 기능에 사용할 계획인지 아직 명확하게 밝히지 않았습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

유혹에 주목하세요 – The New York Times

6d. 어쩌면 이 항목이 처음과 끝이 “Asteroids”와 유사하기 때문일 수도 있지만, 그것은…

Qualcomm Snapdragon X Elite는 Apple Silicon에 대한 Windows 세계의 대답처럼 보입니다 – Ars Technica

확대 / Qualcomm의 Snapdragon X Elite는 Apple Silicon이 Mac에서 수행한 작업을 PC에서…

Google은 Android 앱이 충돌하는 이유와 완화를 자세히 설명합니다.

그에게 속성 : David Emile / Android Authority Google은 지난달 발생한 일련의…

Steam, Epic, GMG는 PSN이 아닌 국가에서 Ghost of Tsuima PC 예약 주문을 취소합니다.

쓰시마의 유령 싱글 플레이 캠페인에서 면제되는 요구사항인 레전드 멀티플레이 모드를 위한 PSN…