A Tencent Hunyuan alapmodellje a funkciók széles skáláját támogatja, többek között a képek létrehozását, a szövegírást, a szövegfelismerést és az ügyfélszolgálatot. Ezek fontos szerepet játszanak majd olyan kulcsfontosságú iparágakban, mint a pénzügy, a közszolgáltatások, a közösségi média, az e-kereskedelem, a közlekedés, a játékok és még sok más.
A Hunyuan-DiT egy innovatív szövegből képet generáló modell, amely kiválóan érti az angol és kínai nyelvet. A modell fejlesztése során a következőket alkották meg a kutatók:
Struktúra: Kifejlesztettek egy új hálózati architektúrát, amely két szövegkódolót használ: egy kétnyelvű CLIP-et és egy többnyelvű T5 kódolót, hogy javítsák a nyelvi megértést és növeljék a kontextus hosszát.
Adatfeldolgozás: Nulláról felépítettek egy adatfeldolgozási folyamatot, amely az adatok hozzáadásától, szűrésétől, karbantartásától, frissítésétől és optimalizálásától kezdve a modell finomhangolásáig terjed.
Képességek: A Hunyuan-DiT képes interaktív párbeszédet folytatni a felhasználókkal, képeket generálva és finomítva a kontextusnak megfelelően.
Értékelés: Több mint 50 szakmai értékelő bevonásával kidolgoztak egy átfogó értékelési protokollt, amely figyelembe veszi a szöveg-kép konzisztenciát, a mesterséges intelligencia által generált torzításokat, a téma tisztaságát és az esztétikát.
A Hunyuan-DiT modell nyílt forráskódú, és a legjobb teljesítményt nyújtja a kínai szövegből kép generálásában az összes nyílt forráskódú modell között. A kutatók remélik, hogy ez a modell hasznos lesz a közösség számára a jobb szövegből képet generáló modellek kifejlesztésében.
*** DiT ***
A DiT alkalmazása a diffúziós képgenerálásban jobb skálázhatóságot és teljesítményt eredményezhet, különösen nagyobb és bonyolultabb képeknél, miközben többféle alkalmazási területen is használható marad. Az U-Net jól bevált és pontos, de a transzformerek nyújtotta előnyök miatt a DiT ígéretes alternatíva.
* Legyél Te is Tagja az Mp3Pintyo csatornának *
[ Ссылка ]
*** DISCORD***
Mp3Pintyo szerver: [ Ссылка ]
*** Támogatás ***
Patreon: [ Ссылка ]
*** Linkek ***
Hunyuan-DiT: [ Ссылка ]
Kutatási anyag: [ Ссылка ]
GitHub DiT: [ Ссылка ]
Hugging Face demo: [ Ссылка ]
GitHub camenduru Google Colab: [ Ссылка ]
GitHub Hunyuan-DiT: [ Ссылка ]
flash-attention: [ Ссылка ]
Hugging Face modellek: [ Ссылка ]
RunPod: runpod.io?ref=2pdhmpu1
Anaconda: [ Ссылка ]
Python: [ Ссылка ]
Git: [ Ссылка ]
*** Indítás ***
conda activate HunyuanDiT
python app/hydit_app.py --lang en --no-enhance
nem kell böngésző: python sample_t2i.py --prompt "a cute cat" --no-enhance
*** Promptok ***
1.
a cute cat
2.
hyper realistic, stoic lion, standing on rock, large mane, black and white
3.
A futuristic car racing through the city, captured in high speed motion blur, with sleek lines and vibrant orange color. The background features towering skyscrapers under golden hour lighting, creating an atmosphere of excitement and adventure. High resolution photography style with sharp focus on the vehicle's design details, emphasizing speed and energy. Digital illustration, with dynamic composition and a sense of urban gaming culture. in the style of gaming culture.
4.
southamerican 15-year-old woman influencer, in her room, in front of the camera, sitting in front of a dressing table wearing a school uniform 4k
5.
Close up shot of an executive faciliator, Spanish professional male, explaining to a group or executives. The scene is set in a hotel. The atmosphere is happy and professional. unsplash,
6.
macdonalds order, tasty and cool
7.
rainbow going over a unicorn for a birthday poster with text "Happy 5th Birthday To Sienna"
8.
photo of real cottage shaped as bear, in the middle of a huge corn field
9.
a man on the left with brown spiky hair, wearing a white shirt with a blue bow tie and red striped trousers. he has purple high-top sneakers on. a woman on the right with long blonde curly hair, wearing a yellow summer dress and green high-heels
A legújabb frissítésben már támogatjuk a 4-bites kvantálást a DialogGen számára, ami csak 21G GPU memóriát igényel a teljes funkcióink (prompt javítás + képgenerálás) megtapasztalásához.
python app/hydit_app.py --lang en --load-4bit
*** BUYING MY ARTS ***
► [ Ссылка ]
► [ Ссылка ]
*** STAY ACTIVE FOR A FOLLOW ***
►TWITTER: [ Ссылка ]
►INSTAGRAM: [ Ссылка ]
►PINTEREST: [ Ссылка ]
►SOUNDCLOUD: [ Ссылка ]
Ещё видео!