Umelá inteligencia - data augmentation

04.04.2020 | 11:54 | Žumpa | bedňa

Pre dobré výsledky pri vyhodnocovaní obrazu neurónovou sieťou potrebujeme približne tisíc obrázkov pre každú kategóriu ktorú chceme rozpoznávať. Toto množstvo je často nedosiahnuteľné a preto si môžeme vyrobiť ďalšie obrázky z tých čo už máme, tak že na ne aplikujeme rôzne grafické efekty po anglicky sa tomu hovorí data augmentation.

Úvod

V minulom zápisku som písal ako si zabezpečiť dataset.
Moje osobné skúsenosti sú, že pokiaľ máme tisíc obrázkov, tak dostaneme výborné výsledky, určité riešenia budú dobre fungovať aj s päťsto obrázkami a čiastočne aj sto obrázkami.

Pri riešení určitých problémov máme obrázkov napríklad len desať, dvadsať, tridsať a tu nám pomôže Keras.

Keras Image Preprocessing

V Kerase máme na toto výborný nástroj Image Preprocessing. S ním si môžeme obrázok rotovať, posunúť, zmeniť jas, zošikmiť, zväčšiť, zmenšiť, prípadne preklopiť.

Takže sa vrátime k nápadu, že chceme na obrázkoch identifikovať našu mamu a máme k tomu v našom prípade dvadsaťdva fotiek Angelina Jolie :-)

Klasicky z ImageDataGenerator lezú náhodne upravené obrázky podľa nami zvolených pravidiel. Keď chceme mať nad týmto procesom kontrolu aby sme výsledok upravených obrázkov videli môžeme použiť tento skript.

Nainštalujeme si ho:

git clone https://github.com/bedna-KU/Controlled-data-augmentation-with-Keras
cd Controlled-data-augmentation-with-Keras

Ak chceme vidieť náhľad pred samotným vygenerovaním obrázkov, použijeme príkaz:

python3 keras_data_aug.py --count 25 --input "images" --output "images_aug" --action show

Zobrazí sa nám náhľad z náhodne vybraného obrázka.

Ak sa nám výsledok páči vygenerujeme si obrázky príkazom:

python3 keras_data_aug.py --count 25 --input "images" --output "images_aug" --action save

--count 25 nám hovorí, že sa vyrobí 25 náhodných obrázkov.
--input je priečinok so vstupnými obrázkami.
--output je priečinok kde sa uložia vygenerované obrázky.
--action je akcia ktorá sa vykoná. Pre náhľad zadáme show a pre uloženie save.

Takto získame 22 x 25 = 550 vygenerovaných obrázkov, čo je aj s našimi pôvodnými dvadsaťdva obrázkami päťstosedemdesiatdva obrázkov, čo už je celkom dosť aby nám umelá inteligencia dokázala obrázky rozlišovať.

Parametre generovania si nastavíme priamo v kóde

Rozostrenie a šum

Dosť dobre pomáha, keď do obrázkov pridáme rozostrenie, alebo šum, tým zas pomôžeme našej neurónovej sieti aby sa nenaučila len na konkrétne obrázky z nášho datasetu. Keď sa chceme pozrieť ako by takto upravený obrázok vyzeral spustíme skript pre náhľad:

python3 blur_and_noise.py --input images --output images_aug --action show

Ak chceme vygenerovať rozostrené obrázky použijeme:

python3 blur_and_noise.py --input images --output images_aug --action blur

No a ak chceme vygenerovať zašumené obrázky použijeme:

python3 blur_and_noise.py --input images --output images_aug --action noise

Keď sa rozhodneme, že k našim päťstosedemdesiatdva obrázkom vygenerujeme ešte päťstosedemdesiatdva rozostrených obrázkov budeme mať spolu tisíc stoštyridsaťštyri obrázkov a to už by nám na naučenie našej neurónovej siete malo stačiť.

Prílohy

Preview_window_keras_data_augmentation.png (1.2 MB)

input_images.jpg (204.5 kB)

keras_data_augmentation_parameters.jpg (96.4 kB)

blur_and_noise.png (2.7 MB)

Pre pridávanie komentárov sa musíte prihlásiť.

Pridať správu

Správy

Distribúcia arix linux s KDE 1

05.04 | 14:35 | Miroslav Bendík

Retro distribúcia arix prináša prostredie kde 1.1.2 na Debian 13 (trixie).

Zdroj: ariasft.github.io

2 komentáre | Zaujímavý projekt

Na Slovensku vyšla bezplatná knižka napísaná umelou inteligenciou

14.03 | 10:26 | Stanislav Hoferek

Dátum udalosti: 13.03.2024

V Greenie knižnici bola vydaná prvá kniha, ktorá je vytvorená z väčšiny umelou inteligenciou. Pokrýva udalosti Druhej svetovej vojny, vrátane rôznych doplnkových tém. Kniha je v angličtine.

Zdroj: Blog na Denníku N

Žiadne komentáre | IT novinky

Zaujímavý web o retro hardvéri

07.03 | 19:08 | redhawk1975

Retro web poskytuje informácie o starom hardvéri

Zdroj: The Retro Web

Žiadne komentáre | Zaujímavý projekt

Apple dostal pokutu 1,8 miliardy €

05.03 | 21:25 | redhawk1975

Ide o čiastkovú časť, ktorú riešia z dôvodu monopolného spravania sa v Appstore.

Zdroj: Európska Komisia

Žiadne komentáre | Novinky

DDoSia bot

04.03 | 14:19 | redhawk1975

Bot využívaný na útoky proti mnohým štátnym inštitúciam v celej Európe dosiahol novú veľkosť.

Žiadne komentáre | Bezpečnosť

Protimonopolný úrad SR sa vyjadril k vypínaniu českých televízií

29.02 | 08:53 | redhawk1975

Protimonopolný úrad zaujal stanovisko k problematike vypínania českých staníc u slovenských poskytovateľov televízie.

Zdroj: Vo svete IT

4 komentáre | Zaujímavý článok

Pomoc pre SK-Spell (PHP8)

25.02 | 17:59 | zdpo

Projekt SK-Spell hľadá programátorov pre dokončenie prechodu na PHP8.x pre projekty Synonymický slovník / SK-Openthesaurus a Online Slovníky / Glossword. V prípade ochoty pomôcť využite issue tracker na Githube alebo napíšte email na zdposter at gmail.com.

Zdroj: sk-spell

Žiadne komentáre | Zaujímavý projekt