Training AI102


Ok saya lanjutkan cerita tentang training AI102 azure. 2 modul terakhir adalah modul 11 dan 12. Modul 11 tentang OCR (Optical character recognition) maksudnya ngenalin text di gambar ato dokumen. Kita belajar pake OCR API yang disedian sama Azure. Pas pengujian sistem dikasi sebuah gambar, sistem diminta mendeteksi dulu ada tulisan apa gak di dalam gambar, trus sistem harus mengesktrak tulisan tersebut. Pengujian berikutnya inputnya diganti pake pdf. Sistem juga diminta mengenali tulisan tangan. Modulnya bisa dilihat disini:

https://microsoftlearning.github.io/AI-102-AIEngineer/Instructions/20-ocr.html

dokumentasinya ada disini:

https://docs.microsoft.com/id-id/azure/cognitive-services/computer-vision/overview-ocr

Tugas berikutnya adalah bikin sistem form recognizer. Sistem ini diminta mengekstrak teks, angka, maupun tabel dari form. Contohnya inputnya bisa invoice, struk pembayaran atau bisnis card. Latihan ini kita bikin resource baru form recognizer. Modulnya bisa dilihat disini:

https://microsoftlearning.github.io/AI-102-AIEngineer/Instructions/21-form-recognizer.html

dokumentasinya bisa dilihat disini:

https://docs.microsoft.com/id-id/azure/applied-ai-services/form-recognizer/

Selanjutnya modul 12, ini modul yang paling panjang. Temanya adalah knowledge mining, alias data mining. Modul ini bikin indexing sama fitur search dokumen. Kita diminta bikin reseource Azure cognitive search, cognitive service resource sama akun storage. Modulnya bisa dilihat disini:

https://microsoftlearning.github.io/AI-102-AIEngineer/Instructions/22-azure-search.html

dokumentasinya bisa dilihat disini:

https://docs.microsoft.com/id-id/azure/search/search-what-is-azure-search

Tugas berikutnya bikin custom skill, fitur ini bisa generate kata yang paling banyak muncul dalam dokumen. Modulnya bisa dilihat disini:

https://microsoftlearning.github.io/AI-102-AIEngineer/Instructions/23-search-skills.html

Dokumentasinya:

https://docs.microsoft.com/id-id/azure/search/cognitive-search-custom-skill-interface

Latihan berikutnya masih ngindeks dokumen. Index biasanya dalam bentuk koleksi dari obyek json, nah latihan ini json dieksport dan digabungkan ke tools azure data factory. Kemudian dilakukan normalisasi indeks dalam bentuk tabel relasi untuk analisa dan reporting menggunakan tools Microsoft Power BI. Kemudian data2 ini disimpan di storage. Modulnya bisa dilihat disini:

https://microsoftlearning.github.io/AI-102-AIEngineer/Instructions/24-knowledge-store.html

dokumentasinya bisa dilihat disini:

https://docs.microsoft.com/id-id/azure/search/knowledge-store-concept-intro?tabs=portal

Semoga Bermanfaat!


Silahkan tuliskan tanggapan, kritik maupun saran