Apple은 현재 AI 게임에서 최고의 플레이어 중 하나는 아니지만 사진 편집을 위한 회사의 새로운 오픈 소스 AI 모델은 해당 분야에 어떤 기여를 할 수 있는지 보여줍니다. 이 모델은 MGIE(MLLM 유도 이미지 편집)라고 하며, MLLM(다중 모드 대형 언어 모델)을 사용하여 이미지를 처리할 때 텍스트 기반 명령을 해석합니다. 즉, 이 도구에는 사용자가 입력하는 텍스트를 기반으로 이미지를 편집하는 기능이 있습니다. 이를 수행할 수 있는 최초의 도구는 아니지만 “인간의 지시는 때로는 기존 방법으로 캡처하고 따르기에는 너무 짧습니다.” 프로젝트 시트 (PDF) 읽어보세요.

이 회사는 캘리포니아 대학교 산타바바라 캠퍼스의 연구원들과 함께 MGIE를 개발했습니다. MLLM은 단순하거나 모호한 텍스트 프롬프트를 이미지 편집기가 직접 따를 수 있는 보다 자세하고 명확한 지침으로 바꾸는 기능을 갖추고 있습니다. 예를 들어, 사용자가 페퍼로니 피자의 이미지를 “건강하게 만들기” 위해 편집하려는 경우 MLLM은 이를 “야채 토핑 추가”로 해석하고 이미지를 편집할 수 있습니다.

피자, 치타, 컴퓨터 및 사람들의 사진.피자, 치타, 컴퓨터 및 사람들의 사진.

사과

MGIE는 이미지를 크게 변경하는 것 외에도 텍스트 프롬프트를 통해 이미지 자르기, 크기 조정 및 회전은 물론 밝기, 대비 및 색상 균형을 향상시킬 수도 있습니다. 또한 이미지의 특정 영역을 수정할 수 있으며, 예를 들어 사진 속 사람의 머리카락, 눈, 옷을 수정하거나 배경의 개체를 제거할 수 있습니다.

좋다 벤처비트 Notes, Apple을 통해 모델 출시 깃허브하지만 관심 있는 사람들은 다음을 시도해 볼 수도 있습니다. 실험적인 현재 Hugging Face Spaces에서 호스팅되고 있습니다. Apple은 이 프로젝트에서 배운 내용을 자사 제품에 통합할 수 있는 도구나 기능에 사용할 계획인지 아직 명확하게 밝히지 않았습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

다양한 소식통이 이번 주에 새로운 Nintendo Direct를 제안하고 있습니다.

다양한 소식통은 새로운 Nintendo Direct가 6월 중, 특히 이번 주에 출시될 예정이라고…

Rockstar는 GTA Definitive Edition 문제에 대해 사과하고 업데이트를 약속합니다.

Rockstar Games는 이에 대한 침묵을 깨고 지저분한 발사 Grand Theft Auto: The…

최고의 프린터 2024, 가정용, 사무용, 포스터 인쇄용, 학교용 프린터, 숙제용 프린터 당신은 프린터입니다 우리는 모두 프린터입니다

Brother 레이저 프린터에 대해 마지막으로 질문한 지 1년이 넘었고, Google의 관심을 끌기…

Amazon Fire 태블릿 및 기타 장비가 Android에서 멀어질 것으로 알려짐 – Ars Technica

게티 이미지/Ma Hi-Fi 매거진 영국 데일리 메일(British Daily Mail)에 따르면 Amazon은 코드명…