Minggu, 15 November 2015

TUGAS PENGANTAR TELEMATIKA MINGGU 2

TEKNOLOGI YANG TERKAIT ANTAR MUKA TELEMATIKA

1. Head-up Display Systems
Head-up display, atau disingkat HUD, adalah setiap tampilan yang transparan menyajikan data tanpa memerlukan pengguna untuk melihat diri dari sudut pandang atau yang biasa. 

1.1. Sejarah HUD
HUD pertama kali diperkenalkan pada tahun 1950-an, dengan adanya teknologi reflektif gunsight pada perang dunia ke dua. Saat itu, suatu tembakan dihasilkan dari sumber listrik yang diproyeksikan ke sebuah kaca. Pemasangan proyektor itu biasanya dilakukan pada bagian atas panel instrumen di tengah daerah pandang pilot, antara kaca depan dan pilot sendiri. 
Dengan menggunakan reflektif gunshight pada pertempuran udara, pilot harus “mengkalibrasi” pandangannya secara manual. Hal ini dilakukan dengan memasukkan lebar sayap target pada sebuah penyetelan roda yang diikuti dengan penyesuaian mata, sehingga target yang bergerak dapat disesuaikan dengan bingkai yang diarahkan kepadanya. HUD terbagi menjadi 3 generasi yang mencerminkan teknologi yang digunakan untuk menghasilkan gambar, yaitu: 

· Generasi Pertama
Gunakan CRT untuk menghasilkan sebuah gambar pada layar fosfor, memiliki kelemahan dari degradasi dari waktu ke waktu dari lapisan layar fosfor. Mayoritas HUD beroperasi saat ini adalah dari jenis ini.
· Generasi Kedua
Gunakan sumber cahaya padat, misalnya LED, yang dimodulasi oleh sebuah layar LCD untuk menampilkan gambar. Ini menghilangkan memudar dengan waktu dan juga tegangan tinggi yang dibutuhkan untuk sistem generasi pertama. Sistem ini pada pesawat komersial.
· Generasi Ketiga
Menggunakan waveguides optik untuk menghasilkan gambar secara langsung dalam Combiner daripada menggunakan sistem proyeksi.

Penggunaan HUD dapat dibagi menjadi 2 jenis. Jenis pertama adalah HUD yang terikat pada badan pesawat atau kendaraan chasis. Sistem penentuan gambar yang ingin disajikan semata-mata tergantung pada orientasi kendaraan. Jenis yang kedua adalah HMD, helm dipasang yang menampilkan HUD dimana elemen akan ditampilkan tergantung pada orientasi dari kepala pengguna.
1.2. Teknologi HUD
· CRT (Cathode Ray Tube)
Hal yang sama untuk semua HUD adalah sumber dari gambar yang ditampilkan, CRT, yang dikemudikan oleh generator.
· Refractive HUD
Dari CRT, sinar diproduksi secara paralel dengan sebuah lensa collimating. Sinar paralel tersebut diproyeksikan ke kaca semitrasnparan (kaca gabungan) dan memantul ke mata pilot. Salah satu keuntungan dari reaktif HUD adalah kemampuan pilot untuk menggerakkan kepalanya dan sekaligus melihat gambar yang ditampilkan pada kaca gabungan.
· Reflective HUD
Kerugian dari HUD reflektif adalah akibatnya pada besarnya tingkat kompleksitas yang terlibat dalam meproduksi penggabungan lekungan dari segi materi dan rekayasa.
· System Architecture
HUD komputer mengumpulkan informasi dari sumber – sumber seperti IRS (Inertial Reference System), ADC (Air Data Computer), radio altimeter, gyros, radio navigasi dan kontrol kokpit. Diterjemahkan ke dalam koordinat x dan y, komputer HUD selanjutnya akan menyediakan informasi yang dibutuhkan untuk hal apa yang akan ditampilkan pada HUD ke generator simbol.
· Display Cutter
Salah satu perhatian penting dengan simbologi HUD adalah kecenderungan perancang untuk memasukkan data terlalu banyak, sehingga menghasilkan kekacauan tampilan. Kekacauan tampilan ini jauh dari eksklusif untuk HUD, tetapi hal ini sangat kritis pada saat melihat ke arah tampilan.

1.3. Faktor Perancangan HUD
Ada beberapa faktor yang harus dipertimbangkan ketika merancang sebuah HUD, yaitu: 
· Bidang penglihatan. Karena mata seseorang berada di dua titik berbeda, mereka melihat dua gambar yang berbeda. Untuk mencegah mata seseorang dari keharusan untuk mengubah fokus antara dunia luar dan layar HUD, layar adalah “Collimated” (difokuskan pada tak terhingga). Dalam tampilan mobil umumnya terfokus di sekitar jarak ke bemper.
· Eyebox. Menampilkan hanya dapat dilihat sementara mata pemirsa dalam 3dimensi suatu daerah yang disebut Kepala Motion Kotak atau “Eyebox”. HUD Eyeboxes modern biasanya sekitar 5 dengan 3 dari 6 inci. Hal ini memungkinkan pemirsa beberapa kebebasan gerakan kepala.
· Terang / kontras. Harus menampilkan pencahayaan yang diatur dalam dan kontras untuk memperhitungkan pencahayaan sekitarnya, yang dapat sangat bervariasi (misalnya, dari cahaya terang awan malam tak berbulan pendekatan minimal bidang menyala).
· Menampilkan akurasi. HUD komponen pesawat harus sangat tepat sesuai dengan pesawat tiga sumbu – sebuah proses yang disebut boresighting – sehingga data yang ditampilkan sesuai dengan kenyataan biasanya dengan akurasi ± 7,0 milliradians.
· Instalasi. Instalasi dari komponen HUD harus kompatibel dengan avionik lain, menampilkan, dll.

2. Tangible User Interface
Tangible User Interface (TUI) adalah sebuah antarmuka pengguna di mana seseorang berinteraksi dengan informasi digital melalui lingkungan fisik. Sebuah TUI adalah salah satu teknologi dimana pengguna berinteraksi dengan sistem digital melalui manipulasi obyek fisik terkait dan langsung mewakili kualitas sistem tersebut. Ide dari TUI adalah untuk memiliki hubungan langsung antara sistem dan cara mengontrol melalui manipulasi fisik dengan memiliki makna yang mendasar atau hubungan langsung yang menghubungkan manipulasi fisik ke perilaku yang mereka picu pada sistem. Karakteristik TUI: 
· Representasi fisik komputasi digabungkan dengan informasi digital yang mendasari.
· Representasi fisik mewujudkan mekanisme kontrol interaktif. 
· Representasi fisik perseptual digabungkan dengan representasi digital secara aktif dimediasi.
· Keadaan fisik tangibles mencakup aspek kunci dari negara digital sistem
Salah satu pionir dalam user interface yang nyata adalah Hiroshi Ishii, seorang profesor di MIT Media Laboratory yang mengepalai Tangible Media Group. Visi tertentu Nya bagi Tangible UIS adalah Bits Tangible, yiatu memberikan bentuk fisik ke informasi digital, membuat bit-bit nya dapat di maniplulasi secara langsung dan terlihat jelas. Tangible bits mengejar kesamaan antara dua dunia yang sangat berbeda yaitu dari bit dan atom. Jadi secara harfiah nya tangible user interface (TUI) adalah sebuah system digital yang membuat sebuah benda menjadi nyata, dapat di sentuh di raba dan memiliki bentuk.

2.1. Penerapan Tangible User Interface
· Mouse
Salah satu penerapan TUI yang paling sederhana adalah pada mouse. Menyeret mouse melalui permukaan datar dan gerakan pointer pada layar yang sesuai merupakan cara berinteraksi dengan sistem digital melalui manipulasi objek fisik.
· Siftables
Merupakan perangkat kecil dari proyek awal di MT Media Lab yang memiliki bentuk menyerupai batu bata kecil yang mempunyai interface. Shiftable memiliki jumlah lebih dari satu dan mampu berkomunikasi serta berinteraksi satu sama lain tergantung pada posisinya. Shiftable yang terpisah tahu kapan shiftable lain berada di dekat mereka dan bereaksi sesuai dengan permainan user.
· Reactable
Reactable adalah alat musik yang dirancang dengan keadaan teknologi seni untuk memungkinkan musisi (dan lainnya) untuk bereksperimen dengan suara dan menciptakan musik yang unik. Instrumen ini didasarkan pada meja bundar tembus dan bercahaya di mana satu set pucks dapat ditempatkan. Dengan menempatkan mereka di permukaan (atau membawa mereka pergi), dengan memutar mereka dan menghubungkan mereka satu sama lain, pemain dapat menggabungkan unsur-unsur yang berbeda seperti synthesizer, efek, loop sampel atau elemen kontrol dalam rangka menciptakan komposisi yang unik dan fleksibel.
Begitu setiap keping ditempatkan di permukaan, keping itu diterangi dan mulai berinteraksi dengan keping lain, menurut posisi dan kedekatannya. Interaksi ini terlihat pada permukaan meja yang bertindak sebagai layar, memberikan umpan balik instan tentang apa yang sedang terjadi di Reactable, mengubah musik ke dalam sesuatu yang terlihat dan nyata.
· Microsoft Surface
Merupakan sebuah teknologi dengan layar multi sentuh yang memungkinkan pengguna untuk berinteraksi dengan built in system pada waktu yang sama. Yang menjadi perhatian adalah hal tersebut bereaksi tidak hanya ketika disentuh, tetapi teknologi ini juga dapat mengenali objek yang ditempatkan diatasnya dan dapat mengatur sendiri perilaku yang terkait dengan benda-benda serta bagaimana kita dapat memanipulasinya.
· Marble Answering Machine
Contoh lain dari Tangiable User Interface adalah Marble Answering Machine (Mesin Penjawab Marmer) oleh Durrell Uskup (1992). Marmer merupakan suatu pesan yang ditinggalkan di mesin penjawab. Menjatuhkan marmer ke piring pemutar,lalu memutar ulang pesan yang terkait.
· Sistem Topobo
Blok di Topobo seperti blok LEGO yang bisa diambil bersama-sama, tetapi juga dapat bergerak sendiri menggunakan komponen bermotor. Seseorang dapat mendorong, menarik, dan memutar blok-blok, dan blok-blok bisa menghafal gerakangerakan ini dan menggulang kembali gerakan-gerakan tersebut. Pelaksanaan lain memungkinkan pengguna untuk sketsa gambar di atas meja sistem dengan pena yang nyata nyata. Sistem ini akan mengintegrasikan kamera video dengan sistem pengenalan isyarat. 

3. Computer Vision
Computer Vision adalah ilmu dan teknologi mesin yang melihat, di mana mesin mampu mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas tertentu. Sebagai suatu disiplin ilmu, visi komputer berkaitan dengan teori di balik sistem buatan bahwa ekstrak informasi dari gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa kamera, atau data multi-dimensi dari scanner medis. Sedangkan sebagai disiplin teknologi, computer vision berusaha untuk menerapkan teori dan model untuk pembangunan sistem computer vision. 
Computer Vision didefinisikan sebagai salah satu cabang ilmu pengetahuan yang mempelajari bagaimana komputer dapat mengenali obyek yang diamati. Cabang ilmu ini bersama Artificial Intelligence akan mampu menghasilkan Visual Intelligence System. Perbedaannya adalah Computer Vision lebih mempelajari bagaimana komputer dapat mengenali obyek yang diamati. Namunkomputer grafik lebih ke arah pemanipulasian gambar (visual) secara digital. Bentuk sederhana dari grafik komputer adalah grafik komputer 2D yang kemudian berkembang menjadi grafik komputer 3D, pemrosesan citra, dan pengenalan pola. Grafik komputer sering dikenal dengan istilah visualisasi data. Computer Vision adalah kombinasi antara:
· Pengolahan Citra (Image Processing), bidang yang berhubungan dengan proses transformasi citra/gambar (image). Proses ini bertujuan untuk mendapatkan kualitas citra yang lebih baik.
· Pengenalan Pola (Pattern Recognition), bidang ini berhubungan dengan proses identifikasi obyek pada citra atau interpretasi citra. Proses ini bertujuan untuk mengekstrak informasi/pesan yang disampaikan oleh gambar/citra.

3.1. Fungsi atau Proses Pada Computer Vision
Untuk menunjang tugas Computer Vision, terdapat beberapa fungsi pendukung ke dalam sistem ini, yaitu:
1. Proses penangkapan citra (Image Acquisition)
· Image Acqusition pada manusia dimulai dengan mata, kemudian informasi visual diterjemahkan ke dalam suatu format yang kemudian dapat dimanipulasi oleh otak.
· Senada dengan proses di atas, computer vision membutuhkan sebuah mata untuk menangkap sebuah sinyal visual.
· Umumnya mata pada computer vision adalah sebuah kamera video.
· Kamera menerjemahkan sebuah scene atau image. 
· Keluaran dari kamera adalah berupa sinyal analog, dimana frekuensi dan amplitudonya (frekuensi berhubungan dengan jumlah sinyal dalam satu detik, sedangkan amplitudo berkaitan dengan tingginya sinyal listrik yang dihasilkan) merepresentasikan detail ketajaman (brightness) pada scene.
· Kamera mengamati sebuah kejadian pada satu jalur dalam satu waktu, memindainya dan membaginyamenjadi ratusan garis horizontal yang sama.
· Tiap‐tiap garis membuat sebuah sinyal analog yang amplitudonya menjelaskan perubahan brightness sepanjang garis sinyal tersebut.
· Kemudian sinyal listrik ini diubah menjadi bilangan biner yang akan digunakan oleh komputer untuk pemrosesan.
· Karena komputer tidak bekerja dengan sinyal analog, maka sebuah analog‐to‐digital converter (ADC), dibutuhkan untuk memproses semua sinyal tersebut oleh komputer.
· ADC ini akan mengubah sinyal analog yang direpresentasikan dalam bentuk informasi sinyal tunggal ke dalam sebuah aliran (stream) sejumlah bilangan biner.
· Bilangan biner ini kemudian disimpan di dalam memori dan akan menjadi data raw yang akan diproses.
2. Proses pengolahan citra (Image Processing)
· Tahapan berikutnya computer vision akan melibatkan sejumlah manipulasi utama (initial manipulation) dari data binary tersebut.
· Image processing membantu peningkatan dan perbaikan kualitas image, sehingga dapat dianalisa dan di olah lebih jauh secara lebih efisien.
· Image processing akan meningkatkan perbandingan sinyal terhadap noise (signal‐to‐noise ratio = s/n).
· Sinyal‐sinyal tersebut adalah informasi yang akan merepresentasikan objek yang ada dalam image.
· Sedangkan noise adalah segala bentuk interferensi, kekurangpengaburan, yang terjadi pada sebuah objek.
3. Analisa data citra (Image Analysis)
· Image analysis akan mengeksplorasi scene ke dalam bentuk karateristik utama dari objek melalui suatu proses investigasi.
· Sebuah program komputer akan mulai melihat melalui bilangan biner yang merepresentasikan informasi visual untuk mengidentifikasi fitur‐fitur spesifik dan karekteristiknya.
· Lebih khusus lagi program image analysis digunakan untuk mencari tepi dan batas‐batasan objek dalam image.
· Sebuah tepian (edge) terbentuk antara objek dan latar belakangnya atau antara dua objek yang spesifik.
· Tepi ini akan terdeteksi sebagai akibat dari perbedaan level brightness pada sisi yang berbeda dengan salah satu batasnya.
4. Proses pemahaman data citra (Image Understanding)
· Ini adalah langkah terakhir dalam proses computer vision, yang mana sprsifik objek dan hubungannya diidentifikasi.
· Pada bagian ini akan melibatkan kajian tentang teknik-teknik artificial intelligent.
· Understanding berkaitan dengan template matching yang ada dalam sebuah scene.
· Metode ini menggunakan program pencarian (search program) dan teknik penyesuaian pola (pattern matching techniques).

3.2. Penerapan Computer Vision
1. Bidang Pengolahan Citra Medis
Hal ini dicirikan dengan ekstraksi informasi dari data gambar untuk tujuan membuat diagnosis medis pasien. Hal ini juga dapat pengukuran dimensi organ, aliran darah, dan lain-lain area aplikasi ini juga mendukung penelitian medis dengan memberikan informasi baru, misalnya, tentang struktur otak, atau tentang kualitas perawatan medis.
2. Bidang Industri 
Kadang-kadang disebut visi mesin, dimana informasi ini diekstraksi untuk tujuan mendukung proses manufaktur. Salah satu contohnya adalah kendali mutu dimana rincian atau produk akhir yang secara otomatis diperiksa untuk menemukan cacat. Mesin visi juga banyak digunakan dalam proses pertanian untuk menghilangkan bahan makanan yang tidak diinginkan dari bahan massal, proses yang disebut sortir optik.
3. Bidang Fisika
Fisika merupakan bidang lain yang terkait erat dengan Computer vision. Sistem Computer vision bergantung pada sensor gambar yang mendeteksi radiasi elektromagnetik yang biasanya dalam bentuk baik cahaya tampak atau inframerah. Sensor dirancang dengan menggunakan fisika solid-state. Proses di mana cahaya merambat dan mencerminkan off permukaan dijelaskan menggunakan optik. Sensor gambar canggih bahkan meminta mekanika kuantum untuk memberikan pemahaman lengkap dari proses pembentukan gambar. Selain itu, berbagai masalah pengukuran fisika dapat diatasi dengan menggunakan Computer vision, untuk gerakan misalnya dalam cairan.
4. Bidang Neurobiologi
Khususnya studi tentang sistem biological vision Selama abad terakhir, telah terjadi studi ekstensif dari mata, neuron, dan struktur otak dikhususkan untuk pengolahan rangsangan visual pada manusia dan berbagai hewan. Hal ini menimbulkan gambaran kasar, namun rumit, tentang bagaimana “sebenarnya” sistem visi beroperasi dalam menyelesaikan tugas-tugas visi tertentu yang terkait.
5. Bidang Matematika Murni
Sebagai contoh, banyak metode dalam visi komputer didasarkan pada statistik, optimasi atau geometri. Akhirnya, bagian penting dari lapangan dikhususkan untuk aspek pelaksanaan visi komputer, bagaimana metode yang ada dapat diwujudkan dalam berbagai kombinasi perangkat lunak dan perangkat keras, atau bagaimana metode ini dapat dimodifikasi untuk mendapatkan kecepatan pemrosesan tanpa kehilangan terlalu banyak kinerja.
6. Bidang Pemrosesan Sinyal
Banyak metode untuk pemrosesan sinyal satu-variabel, biasanya sinyal temporal, dapat diperpanjang dengan cara alami untuk pengolahan sinyal dua variabel atau sinyal multi-variabel dalam visi komputer. Namun, karena sifat spesifik gambar ada banyak metode dikembangkan dalam visi komputer yang tidak memiliki mitra dalam pengolahan sinyal satu-variabel.
7. Bidang Pertahanan Dan Keamanan (Militer)
Contoh jelas adalah deteksi tentara musuh atau kendaraan dan bimbingan rudal. Lebih sistem canggih untuk panduan mengirim rudal rudal ke daerah daripada target yang spesifik, dan pemilihan target yang dibuat ketika rudal mencapai daerah berdasarkan data citra diperoleh secara lokal. Dalam hal ini, pengolahan otomatis data yang digunakan untuk mengurangi kompleksitas dan informasi sekering dari sensor ganda untuk meningkatkan keandalan.
8. Bidang Didalam Kendaraan Otonom
Meliputi submersibles, berbasis kendaraan darat (robot kecil dengan roda, mobil atau truk), kendaraan udara, dan kendaraan udara tak berawak (UAV). Tingkat berkisar otonomi dari sepenuhnya otonom (berawak) kendaraan untuk kendaraan di mana sistem visi berbasis komputer mendukung driver atau pilot dalam berbagai situasi. Hal ini juga dapat digunakan untuk mendeteksi peristiwa-peristiwa tugas tertentu yang spesifik, misalnya, sebuah UAV mencari kebakaran hutan. kendaraan otonom menggunakan visi komputer, misalnya, NASA Mars Exploration Rover dan ESA exomars Rover.
9. Bidang Kecerdasan Buatan
Keterkaitan dengan perencanaan otonom atau musyawarah untuk sistem robotical untuk menavigasi melalui lingkungan. Pemahaman yang rinci tentang lingkungan ini diperlukan untuk menavigasi melalui mereka. Informasi tentang lingkungan dapat diberikan oleh sistem visi komputer, bertindak sebagai sensor visi dan memberikan informasi tingkat tinggi tentang lingkungan dan robot. Buatan kecerdasan dan visi lain berbagi topik komputer seperti pengenalan pola dan teknik pembelajaran. Akibatnya, visi komputer kadang-kadang dilihat sebagai bagian dari bidang kecerdasan buatan atau ilmu bidang komputer secara umum.
10. Bidang Industri Perfilman
Semua efek-efek di dunia akting, animasi, dan penyotingan adegan film semua di fs rekam dengan perangkat elektronik yang dihubungkan dengan komputer. Animasinya juga di kembangkan mempergunakan animasi yang dibuat dengan aplikasi komputer. Sebagai contoh film-film Hollywood berjudul TITANIC itu sebenarnya tambahan animasi untuk menggambarkan kapal raksasa ya.

4. Browsing Audio Data
Sebuah metode browsing jaringan disediakan untuk browsing video / audio data yang ditembak oleh sebuah IP kamera. Jaringan video / audio metode browsing sesuai mencakup langkah-langkah dari: 
· Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi yang disimpan dalam kamera IP,
· Transmisi untuk mendaftarkan kode identifikasi ke DDNS (Dynamic Domain Name Server) oleh program aplikasi,
· Mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi dan,
· Kopel ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video / audio data yang ditembak oleh kamera IP, di mana server layanan menangkap video / audio data yang ditembak oleh kamera IP melalui Internet.
Pada perkembangan sejarahnya Audio mengalami 4 fase, yaitu:
1. Fase pertama, dikenal juga dengan Tehnik Audio – Mono ini umumnya dikenal sekitar periode tahun 20’an hingga sekitar akhir tahun 50’an dengan diketemukannya Alat Gramaphone oleh Thomas Alfa Edison dengan metode Plat Baja,
2. Fase kedua, sekitar awal tahun 50’an dengan diketemukan Perekaman Analog dengan piringan plat hitam maka orang mulai mengenal perekaman Mono stereo dengan metode pemisahan suara (Vokal dan Alat Musik) menjadi L / R (Music; Left – output, Voice; Right – output)
3. Fase ketiga, ditemukan tehnik Mixing Stereo menjadi L /R, ini populer sekali dan dikembangkan terus hingga sekitar tahun 60’an akhir – awal 70’an
4. Fase keempat, Proses perekaman Umumnya saat ini didalam produksi audio umumnya dilakukan dari Analog Ke Digital begitupun sebaliknya. Data Analog mempunyai pengertian adalah data sinyal gelombang suara yang dikeluarkan dari Sumber Aslinya hasil perekaman, misal: Perekaman Vokal ke komputer. Data Analog sendiri mempunyai pengertian adalah Informasi gelombang suara yang terus menerus berubah tidak beraturan secara Alami, Data Analog mengalami perubahan keras (Amplitudo) dan tinggi rendah suara yang berfluktuasi, namun belum mempunyai Skala & satuan yang pasti, sedangkan Data Digital adalah hasil manipulasi Informasi gelombang suara secara terus menerus berubah tidak beraturan secara alami menjadi satuan skala yang pasti.

5. Speech Recognition
Speech recognition (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat.
Pengenalan ucapan (speech recognition) dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi dua kategori, yaitu:
· Piranti pengenalan kata (word recognition) yang mampu merespon ucapan-ucapan secara individu atau perintah-perintah yang menggunakan teknik yang dikenal sebagai speaker verification. Pertama kali sistem akan membangkitkan suatu template untuk mengenali suara user.
· Piranti pengenalan kalimat (speech recognition) yang mampu mengenali hubungan antar kata terucap di dalam kalimat atau frase. Teknik - teknik statistik dipakai dalam hal pola perekaman suara yang akan dicocokkan dengan kata-kata terucap. 

5.1. Prinsip Dasar Speech Recognition
Semua metode dasar proses pengenalan suara terdiri dari dua fase operasi, yaitu:
· Proses training. Pada proses ini sistem belajar dari referensi pola yang berupa perbedaan pola sinyal suara misal frase, kata, fonem yang akan mengisi vocabulari dari sistem. Setiap referensi di pelajari dari kata yang dikatakan yang kemudian disimpan dalam template dan telah mengalami metode untuk meratarata dan karakteristik statistik dan parameter statistik. 
· Proses recognition. Pada proses ini sistem akan diberikan inputan yang belum diketahui dan akan di identifikasi berdasarkan pola template yang telah didapatkan pada proses training.
Pada umumnya, suatu sistem pengenalan suara terdiri dari beberapa modul utama, yaitu:
· Signal processign frontend digunakan untuk mengkonversi sinyal suara kedalam bentuk sequence feature vector yang akan digunakan pada saat klasifikasi.
· Accoustic modelling digunakan untuk memodelkan secara statistik hasil training yang telah dilakukan kedalam sebuah template. 
· Language modelling digunakan untuk memodelkan bentuk kata baik berupa kata, fonem, ataupun kalimat.

6. Speech Synthesis
Speech synthesis adalah transformasi dari teks ke arah suara (speech). Transformasi ini mengkonversi teks ke pemadu suara (speech synthesis) yang sebisa mungkin dibuat menyerupai suara nyata, disesuaikan dengan aturan – aturan pengucapan bahasa.TTS (text to speech) dimaksudkan untuk membaca teks elektronik dalam bentuk buku, dan juga untuk menyuarakan teks dengan menggunakan pemaduan suara. Sistem ini dapat digunakan sebagai sistem komunikasi, pada sistem informasi referral, dapat diterapkan untuk membantu orangorang yang kehilangan kemampuan melihat dan membaca. Ada beberapa masalah yang terdapat pada pemaduan suara, yaitu:
· User sangat sensitif terhadap variasi dan informasi suara. Oleh sebab itu, mereka tidak dapat memberikan toleransi atas ketidaksempurnaan pemadu suara. 
· Output dalam bentuk suara tidak dapat diulang atau dicari dengan mudah.
· Meningkatkan keberisikan pada lingkungan kantor atau jika menggunakan handphone, maka akan meningkatkan biaya pengeluaran.
Speech Synthesis atau sintesis pidato adalah kemampuan sebuah komputer untuk menghasilkan suara yang menyerupai suara manusia. Meskipun mereka tidak bisa meniru spektrum penuh irama manusia dan intonasi. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut synthesizer pidato, dan dapat diimplementasikan dalam perangkat lunak atau hardware. Speech Synthesis adalah termasuk sebuah teks-to-speech (TTS), yaitu sistem mengkonversi teks ke dalam pidato bahasa normal. 
Speech sintesis menjadi alat bantu teknologi vital dan penerapannya di daerah ini sangat signifikan dan luas, sekarang umum digunakan oleh orang-orang dengan disleksia dan kesulitan membaca lainnya maupun oleh anak-anak pra-melek. Sementara itu, aplikasi sintesis pidato dan gadget pada bahasa alat belajar. Teknik sintesis Pidato sekarang juga digunakan dalam produksi hiburan seperti game, anime dan yang sejenis, dan banyak digunakan dalam produk telekomunikasi juga. 

Sumber:

1 komentar: