tulisan: November 2012

4. Browsing Audio Data dan Speech Recognition

Browsing Audio Data
Sebuah metode browsing jaringan disediakan untuk browsing video/audio data yang ditembak oleh sebuah IP kamera. Jaringan video/audio metode browsing sesuai mencakup langkah-langkah dari:

(i) menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi yang disimpan dalam kamera IP,

(ii) transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server) oleh program aplikasi,

(iii) mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi dan

(iv) kopel ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video / audio data yang ditembak oleh kamera IP, di mana server layanan menangkap video / audio data yang ditembak oleh kamera IP melalui Internet. Sebagai kemajuan teknologi jaringan, semakin banyak diterapkan jaringan produk yang dibuat-buat terus-menerus. Salah satu yang paling umum diterapkan jaringan yang dikenal adalah produk kamera IP, yang dapat menampilkan isi (video / audio data) melalui Internet. Kamera IP biasanya terhubung ke jaringan melalui router, dan memiliki sebuah IP (Internet Protocol) address setelah operasi sambungan. Jaringan video / audio sistem browsing penemuan yang sekarang digunakan untuk browsing video / audio data yang ditembak oleh sebuah IP kamera. Sistem penjelajahan termasuk DDNS (Dynamic Domain Name Server), sebuah IP kamera disimpan dengan kode identifikasi, sebuah layanan server, sebuah komputer lokal dan setidaknya satu client. Masing-masing item sebelumnya terhubung ke Internet.

Speech Recognition
Pengenalan ucapan, atau yang sering disebut dengan Automatic Speech Recognition (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara.
Pengenalan ucapan dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi dua, yaitu pengenalan pengguna (identifikasi suara berdasarkan orang yang berbicara) dan pengenalan ucapan (identifikasi suara berdasarkan kata yang diucapkan).
Jenis-jenis pengenalan ucapan :
Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan kata, yaitu :

1. Kata-kata yang terisolasi

Proses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata.

2. Kata-kata yang berhubungan
Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat.

3. Kata-kata yang berkelanjutan
Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini sangat rumit karena membutuhkan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural.

Resource :
http://n.wikipedia.org
http://www.wisegeek.com/what-is-speech-synthesis.htm
http://www.freshpatents.com/Network-video-audio-browsing-system-and-browsing-method-thereof-dt20090702ptan20090172088.php
http://www.computer.org/portal/web/csdl/doi/10.1109/ICFCC.2009.123

2. TUI (Tangible User Interface)

Tangible User Interface (TUI) adalah sebuah antarmuka pengguna di mana orang berinteraksi dengan informasi digital melalui lingkungan fisik. Nama awal Graspable User Interface, yang tidak lagi digunakan. Salah satu pelopor dalam antarmuka pengguna nyata adalah Hiroshi Ishii, seorang profesor di MIT Media Laboratory yang mengepalai Berwujud Media Group. Pada visi-Nya nyata UIS, disebut Berwujud Bits, adalah memberikan bentuk fisik ke informasi digital, membuat bit secara langsung dimanipulasi dan terlihat.
Karakteristik Berwujud User Interfaces :
• Representasi fisik digabungkan untuk mendasari komputasi informasi digital.
• Representasi fisik mewujudkan mekanisme kontrol interaktif.
• Representasi fisik perseptual digabungkan untuk secara aktif ditengahi representasi digital.
• Keadaan fisik terlihat “mewujudkan aspek kunci dari negara digital dari sebuah sistem.
Contoh :
Sebuah contoh nyata adalah Marmer UI Answering Machine oleh Durrell Uskup (1992). Sebuah kelereng mewakili satu pesan yang ditinggalkan di mesin penjawab. Menjatuhkan marmer ke piring diputar kembali pesan atau panggilan terkait kembali pemanggil. Contoh lain adalah sistem Topobo. Balok-balok dalam LEGO Topobo seperti blok yang dapat bentak bersama, tetapi juga dapat bergerak sendiri menggunakan komponen bermotor. Seseorang bisa mendorong, menarik, dan memutar blok tersebut, dan blok dapat menghafal gerakan-gerakan ini dan replay mereka. Pelaksanaan lain memungkinkan pengguna untuk membuat sketsa gambar di atas meja sistem dengan pena yang benar-benar nyata. Menggunakan gerakan tangan, pengguna dapat mengkloning gambar dan peregangan dalam sumbu X dan Y akan hanya sebagai salah satu program dalam cat. Sistem ini akan mengintegrasikan kamera video dengan gerakan sistem pengakuan.
Contoh lain adalah logat, pelaksanaan TUI membantu membuat produk ini lebih mudah diakses oleh pengguna tua produk. ‘teman’ lewat juga dapat digunakan untuk mengaktifkan interaksi yang berbeda dengan produk. Beberapa pendekatan telah dilakukan untuk membangun middleware untuk TUI generik. Mereka sasaran menuju kemerdekaan aplikasi domain serta fleksibilitas dalam hal teknologi sensor yang digunakan. Sebagai contoh, Siftables menyediakan sebuah platform aplikasi yang sensitif menampilkan gerakan kecil bertindak bersama-sama untuk membentuk antarmuka manusia-komputer.

3. Computer Vision (Visi Komputer) dan Middleware Telematika

Computer Vision (Visi Kompoter)

Visi komputer merupakan ilmu pengetahuan dari bidang teknologi mesin. Dalam hal ini mesin dapat mengekstrak informasi dari image untuk menyelesaikan beberapa tugas. Sebagai disiplin ilmu, visi komputer erat hubungannya dengan sistem buatan yang mengekstrak informasi dari image. Data image dapat mengambil banyak bentuk, seperti rangkaian video, multi-dimensional data dari penyaring gambar tv medis. Computer vision dapat didifinisikan setara dengan pengolahan citra, yang dikaitkan pula dengan akuisisi citra, pemrosesan, klasifikasi, rekognisi, dan pencakupan keseluruhan, pengambil keputusan diikuti dengan pengidentifikasian citra.
Contoh implementasi sistem visi komputer:
• Pengontrolan proses (robot industri atau kendaraan otonom)
• Pendeteksi gerakan (untuk pengawasan visual).
• Pengorganisir informasi (untuk indeks basis data image dan rangkaian image).
• Peragaan obyek atau lingkungan (pemeriksaan industri, analisis image medis atau memperagakan petabumi).
• Interaksi (sebagai input/masukan untuk interaksi manusia komputer).

Middleware Telematika

sebuah program yang digunakan atau berfungsi untuk menghubungkan 2 buah program yang berada di 2 buah layer yang berbeda. Middleware juga sering disebut sebagai protokol.

Beberapa fungsi dari Middleware Telematika adalah:

· Membuat sebuah aplikasi yang dapat dioperasikan di berbagai sistem operasi serta komputer yang bebeda.

· Mengisi ruang kosong yang ada diantara sistem operasi dan aplikasi.

Minggu, 04 November 2012

4. Browsing Audio Data dan Speech Recognition

2. TUI (Tangible User Interface)

3. Computer Vision (Visi Komputer) dan Middleware Telematika