Selasa, 17 November 2015

Speech synthesis

Speech synthesis

Speech synthesis adalah transformasi dari teks ke arah suara (speech). Transformasi ini mengkonversi teks ke pemadu suara (speech synthesis) yang sebisa mungkin dibuat menyerupai suara nyata, disesuaikan dengan aturan – aturan pengucapan bahasa.TTS (text to speech) dimaksudkan untuk membaca teks elektronik dalam bentuk buku, dan juga untuk menyuarakan teks dengan menggunakan pemaduan suara. Sistem ini dapat digunakan sebagai sistem komunikasi, pada sistem informasi referral, dapat diterapkan untuk membantu orang-orang yang kehilangan kemampuan melihat dan membaca.

Ada beberapa masalah yang terdapat pada pemaduan suara, yaitu:
1)      @ User sangat sensitif terhadap variasi dan informasi suara. Oleh sebab itu, mereka tidak dapat memberikan toleransi atas ketidaksempurnaan pemadu suara.
2)           @ Output dalam bentuk suara tidak dapat diulang atau dicari dengan mudah.
3)        @ Meningkatkan keberisikan pada lingkungan kantor atau jika menggunakan handphone, maka akan meningkatkan biaya pengeluaran.

Lingkungan dari aplikasi pemadu suara adalah:
Bagi tunanetra, pemadu suara menawarkan media komunkasi dimana mereka dapat memiliki akses yang tidak terbatas. Lingkungan dimana visual dan haptic skill user berfokus pada hal lain.

Contohnya: sinyal bahaya pada kokpit pesawat udara.

Sejarah Speech Synthesis

Upaya yang paling awal untuk menghasilkan lahirnya pemandu suara, pada abad XVIII. Terlepas dari kenyataan bahwa upaya pertama  adalah bentuk mesin mekanis, kita dapat mengatakan hari ini  bahwa synthesizer sudah berkualitas tinggi. Pada tahun 1779 di St Petersburg, Rusia Profesor Kratzenshtein Kristen  fisiologis menjelaskan perbedaan antara lima vokal panjang  (/ A /, / e /, / i /, / o /, dan / u /) dan membuat alat untuk menghasilkan  mereka artifisial. Tahun 1791 di Wina, Wolfgang von Kempelen memperkenalkan nya “Akustik-Mekanik Mesin Speech”. Dalam  sekitar pertengahan 1800-an Charles Wheatstone dibangun terkenal  versi mesin berbicara von Kempelen’s.

Generasi dari sistem pemaduan suara ini dapat dibagi ke dalam 3 masa, yaitu:

1)      Generasi pertama (1962-1977). Format sintesis dari fonem adalah teknologi dominan. Teknologi ini memanfaatkan aturan berdasarkan penguraian fonetik pada kalimat untuk kontur frekuensi forman. Beberapa sintesis masih miskin atau kurang  dalam kejelasan dan kealamiannya.

2)      Generasi kedua (1977-1992). Metode pemadu suara adalah diphone diwakilkan  dengan parameter LPC. Hal tersebut menunujukkan bahwa kejelasan yang baik pada pemadu suara dapat diperoleh dengan andal dari input teks dengan menggabungkan diphone yang sesuai dengan unit. Kejelasan meningkat selama sintesis forman, tetapi kealamian dari pemadu suara masih tetap rendah.


3)      Generasi ketiga (1992-sekarang). Generasi ini ditandai dengan metode ‘ sintesis pemilihan unit’ yang diperkenalkan dan disempurnakan oelh Sagisaka di Labs ATR Kyoto. Hasil dari pemandu suara pada periode ini sangat mendekati  human-generated speech pada bagian kejelasan dan kealamian,

Teknologi pemadu suara modern melibatkan metode dan algoritma yang canggih dan rumit. alat pemadu suara  dari keluarga “Infovox” mungkin mejadi salah satu multi bahasa TTS yang paling dikenal saat ini. Versi komersial pertamanya, Infovox-SA 101, dikembangkan pada tahun 1982 di Institute Teknologi Royal, Swedia dan didasarkan pada sintesis forman. AT & T Bell Laboratories (Lucent Technologies) juga memiliki tradisi yang sangat panjang tentang pemandu suara (speech synthesis). TTS lengkap yang pertama didemostrasikan di Boston pada tahun 1972 dan diliris pada tahun 1973. Hal ini didasarkan pada model artikulatoris yang sikembangkan oleh Ceceil Coker (Klatt 1987). Pengembangan proses dari sistem penggabungan sintesis ini dimulai oleh Joseph Olive pada pertengahan tahun 1970-an (Bell Labs 1997). Sistem ini sekarang sudah tersedia untuk bahasa Inggris, Perancis, Spanyol, Italia, Jerman, Rusia, Rumania, Cina, dan Jepang (Mcbius et al 1996).


Speech Synthesis

Speech synthesis atau pidato sintesis adalah produksi buatan manusia pidato. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut speech synthesizer, dan dapat diimplementasikan dalam perangkat lunak atau perangkat keras. text-to-speech (TTS) sistem bahasa normal mengkonversi teks ke dalam pidato. sistem lain membuat representasi linguistik simbolis seperti transkripsi fonetik bicara.
Pidato buatan dapat dibuat dengan potongan-potongan concatenating pidato yang direkam disimpan dalam database. Sistem berbeda dalam ukuran pidato yang disimpan unit; sebuah sistem yang menyimpan telepon memberikan rentang output terbesar, tapi mungkin kurang jelas. Untuk keperluan khusus domain, yang menyimpan seluruh kata-kata atau kalimat memungkinkan output yang berkualitas tinggi. Atau, synthesizer dapat menggabungkan sebuah model dari sistem vokal dan karakteristik suara manusia lain untuk membuat yang benar-benar “sintetik” output suara. Kualitas synthesizer pidato dinilai oleh kesamaan dengan suara manusia dan kemampuannya untuk dipahami. semua dimengerti text-to-speech program yang memungkinkan orang-orang dengan gangguan visual atau membaca untuk mendengarkan karya-karya tulis di komputer rumah. Banyak sistem operasi komputer termasuk alat bicara sejak awal 1980-an.

A text-to-speech system (atau “mesin”) adalah terdiri dari dua bagian: front-end dan back-end. Front-end memiliki dua tugas utama. Pertama, mengubah teks mentah berisi simbol seperti angka dan singkatan menjadi setara dengan tertulis-kata-kata. Proses ini sering disebut normalisasi teks, pra-pengolahan, atau tokenization. Front-end kemudian menetapkan transkripsi fonetik untuk setiap kata, dan membagi dan menandai teks ke prosodic unit seperti frase dan kalimat. Proses transkripsi fonetik untuk menetapkan kata-kata ini disebut teks-ke-fonem atau grafem-ke-fonem konversi. Fonetis transkripsi dan informasi ilmu persajakan bersama-sama membentuk representasi simbolik yang linguistik output dengan front-end. Back-end-sering disebut sebagai synthesizer-maka mengubah representasi linguistik simbolik menjadi suara.

Suara teks-to-speech engine di Vista adalah Microsoft Anna, dan Microsoft Sam pada Windows XP. Vista pengguna dapat mendengar suara sangat jelas dari Anna, dan kualitas suara Anna Microsoft jauh lebih baik daripada Microsoft Sam. Sintesis pidato Windows program yang disebut narator telah dikirimkan dengan Windows2000, Windows XP dan Vista. Bila pengguna Windows ingin mendapatkan suara tidak hanya membaca tetapi juga file audio seperti gelombang dan file mp3 pidato, mereka dapat menginstal bebas teks-to-speech dan panopreter text-to-mp3 aplikasi yang ditawarkan oleh panopreter.com. Hal membaca file teks dan mengkonversi pidato menjadi gelombang dan mp3 file, pengguna dapat mengimpor file audio yang dihasilkan ke perangkat portabel, dan mendengarkan mereka sambil berjalan, jogging atau Komuter untuk bekerja.
Speech sintesis menjadi alat bantu teknologi vital dan penerapannya di daerah ini sangat signifikan dan luas, sekarang umum digunakan oleh orang-orang dengan disleksia dan kesulitan membaca lainnya maupun oleh anak-anak pra-melek. Sementara itu, aplikasi sintesis pidato dan gadget pada bahasa alat belajar. Teknik sintesis Pidato sekarang juga digunakan dalam produksi hiburan seperti game, anime dan yang sejenis, dan banyak digunakan dalam produk telekomunikasi juga.

SUMBER :

COMPUTER VISION

Pengertian 

Computer vision didefinisikan sebagai salah satu cabang ilmu pengetahuan yang mempelajari bagaimana komputer dapat mengenali obyek yang diamati atau diobeservasi. Arti dari computer vision adalah ilmu dan teknologi mesin yang melihat, dimana mesin mampu mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas tertentu. 
Fungsi 
Untuk menunjang tugas computer vision, maka terdapat beberapa fungsi pendukung ke dalam sistem ini antara lain : 
Ø  Proses penangkapan citra /gambar
Ø  Proses pengolahan citra
Ø  Analisa data citra
Ø  Proses pemahaman data citra
Sebuah computer yang menyerupai kemampuan manusia dalam menangkap sinyal visual dilakukan dalam empat tahapan proses dasar :
1.   Image Acquisition
Pada manusia dimulai dengan mata, kemudian informasi visual diterjemahkan ke dalam suatu format yang kemudian dapat dimanipulasi oleh otak.  Senada dengan proses di atas, computer vision membutuhkan mata untuk menangkap sinyal visual.
Contohnya :
Kamera menterjemahkan sebuah scene atau image.
2.   Image processing
Image processing membantu peningkatan dan perbaikan kualitas image, sehingga dapat dianalisa dan di olah lebih jauh secara lebih efisien. Image processing akan meningkatkan perbandingan sinyal terhadap noise. Sinyal-sinyal tersebut adalah informasi yang akan merepresentasikan objek yang ada didalam image. Noise adalah segala bentuk interfensi, kekurangan yang terdapat pada objek.
3.   Image Analysis
Image analysis akan mengeksplorasi scene ke dalam bentuk karakteristik utama dari objek melalui suatu proses investigasi. Program analysis digunakan untuk mencari  tepi  dan batas-batasan objek kedalam image.
4.   Image Understanding
Merupakan langkah terakhir  dalam proses computer vision.pada bagian ini akan melibatkan kajian tentang tehnik-tehnik artificial intelligent.

>> Aplikasi
Beberapa aplikasi yang dihasilkan dari Computer Vision antara lain :
Ø  Robotic – navigation and control
Ø  Medical Image Analysis – measurement and interpretation of many types of images
Ø  Industrial Inspection – measurement, fault checking, process control 
Ø  Optical Character Recognition – text reading 
Ø  Remote Sensing – land use and environmental monitoring
Ø  Psychology, AI – exploring representation and computation in natural vision

referensi : 
http://komputer-vision-universitas.blogspot.co.id/

INTERFACING ( PENGANTARMUKAAN)

INTERFACING
Komputer saat ini telah menjadi alat bantu utama bagi manusia dan digunakan bukan hanya untuk menyelesaikan permasalahan di tempat kerja, membuat program atau bermain game, tetapi dapat digunakan untuk mengontrol alat melalui berbagai port yang tersedia dan dikenal dengan istilah Interfacing komputer. Interfacing (antar muka) adalah bagian dari disiplin ilmu komputer yg mempelajari teknik-teknik menghubungkan komputer dengan peralatan elektronika lainnya. Sistim komputer yang berpusat pada pemroses utama (baik itu Mikroprosesor maupun Mikrokontroler) memiliki kemampuan yang besar dalam memecahkan masalah tetapi tidak ada manfaatnya tanpa menghubungkan dengan peralatan lainnya. Suatu teknik khusus diperlukan untuk dapat menghubungkan dengan peralatan-peralatan tersebut. Menghubungkan pemroses utama dengan peralatan elektronik lainnya bukanlah persoalan yang mudah.
Pada dasarnya sistem mikroprosesor, tidak terlepas dari sebuah interfacing yang merupakan bagian dari rangkaian elektronika. Secara hirarki struktur interfacing terdapat beberapa layer, diantaranya yaitu:
A.    Electrical (physical) : Fungsi dari layer electrical merupakan layer yang mendasar dari suatu interfacing. Layer ini adalah layar fisik, karena interfacing dalam penggunaan umum berkaitan dengan setiap alat yang penggunaannya adalah elektronika. Teknik Interfacing physical merupakan pengembangan dari elektronika dan analog.

B.     Signal :Layer signal merupakan layer yang digunakan untuk menyampaikan dari satu titik ke titik yang lainnya. Pada layer ini tergantung dari layer elektrical (fisik) yang dalam penggunaann umum, arus listrik yang digunakan untuk menyampaikan data melalui sirkuit. Layer signal adalah teknik pengembangan pada elektrical interfacing, bus interfacing, dan data transfer.

C.     Logic : Pada layer logic merupakan suatu bentuk argumentasi tanpa memandang arti khusus dari istilah argumentasi lain. Hal ini dikarenakan layer signal sebagai penyampai datanya adalah arus listrik. Layer logic adalah pengalamatan dari rangkaian aplikasi, bus interfacing, dan data transfer.


D.    Protocol : Merupakan satu set peraturan dan prosedur untuk bertukar-tukar data. Protocol interfacing adalah ilmu yang merupakan standar dan implementasi dari suatu komunikasi.

E.     Code : Layer code merupakan representasi simbolik dari data atau intruksi dalam bentuk kode atau intruksi.


F.      Algorithmic : Merupakan suatu yang berhubungan dengan penggunaan algorithma untuk mendapatkan suatu hasil dalam interfacing

Ruang Lingkup Interfacing
Interfacing bukanlah disiplin ilmu yang berdiri sendiri tetapi berkaitan erat dengan disiplin ilmu komputer lainnya. Pemahaman yang mendalam dari disiplin lainnya yang berkaitan dengan bahasan interfacing ini akan sangat membantu untuk memahami materi-materi yang disajikan selanjutnya. Disiplin ilmu komputer ini adalah Elektronika Analog dan Digital, Mikroprosesor, Organisasi dan Arsitektur Komputer, Komunikasi Data serta pendukung Bahasa Pemrograman, baik berbasis Teks seperti Bahasa Rakitan atau Assembly, C, Basic, Pascal maupun berbasis Grafis seperti Visual Basic, Visual C, Delphi bahkan berbasis Web seperti Java.
Operasi – Operasi I/O
Sistem computer tidak akan berguna tanpa adanya peralatan input dan output (I/O). Diperlukan suatu modul I/O yang menghubungkan peralatan ini ke dalam system computer. Modul ini menjalankan dua fungsi utama yaitu:
a.       Sebagai interface dari dan ke CPU (Mikroprosessor) dan memori melaui bus system sentral.
b.      Sebagai interface sebuah perangkat peripheral atau lebih menggunakan sambungan data tertentu.
Perangkat eksternal dihubungkan dengan computer oleh suatu sambungan dengan modul I/O. Sambungan (link) digunakan untuk pertukaran control, status dan data antar modul I/O dengan perangkat eksternal. Perangkat eksternal sering disebut dengan peripheral. Signal – signal yang dipertukarkan dalam bentuk control, status dan data.
Ada dua metode interfacing I/O yang berbeda dalam system berbasis mikroprosessor yaitu yang terisolasi dan I/O yang dipetakan dalam memory. Pada masukan keluaran berdasarkan I/O yang terisolasi, prosessor mengirim sinyal pengendali yang menunjukkan bahwa siklus sekarang ini hanya untuk mengakses alat-alat I/O. masukan keluaran yang dipetakan dalam memori memungkinkan prosessor menggunakan intruksi yang sama untuk alih memori seperti yang digunakan untuk alih masukan keluaran.

Teknik Pengendalian
 Ada tiga metode pengendalian masukan keluaran yang akan dibahas dalam bagian ini:
Ø  Programmed I/O
Ø  Interrupt driven I/O
Ø  DMA (Direct Memori Access


A.    Programmed I/O
Tehnik ini disebut juga pemilihan saluran dimana semua pengalihan ke dalam diri alat diselenggarakan oleh program. Prosessor mengirim dan meminta data, semua operasi masukkan dan keluaran berada dibawah kendali program. Pengalihan harus dikoordinasi oleh suatu proses handshaking.
Program terus berjalan lewat sejumlah pengetesan untuk menentukan apakah masukan atau keluaran dapat / harus diselenggarakan. Bila ditemukan alat yang memerlukan pelayanan, rutin pelayanan yang sesungguhnya diaktifkan dan pemilihan saluran berlangsung lagi setelah pelayanan selesai dilakukan. Dua metode dasar penginderaan isyarat alat siap yang dipakai adalah pemakaian pintu status mwsukan pengkode prioritas.
B.     Interrupt Driven I/O
Teknik pemilihan saluran memiliki dua keterbatasan yaitu pemborosan waktu prosessor waktu dan lambat. Diperlukan suatu cara agar alat yang membutuhkan pelayanan dapat segera dilayani tanpa menunggu gilirannya tiba. Prosedur ini dinamakan interrupt.
C.     DMA / Direct Memory Access
Teknik interupsi menjamin tanggapan paling cepat yang mungkin terhadap alat masukan – keluaran. Akan tetapi pelayanan ini masih melibatkan perangkat lunak. Hal inidirasa masih kurang cepat bagi pengolahan yang membutuhkan transfer data langsung dari memori seperti Disk drive dan CRT.
Interface Internal
Bus merupakan lintasan komunkasi yang menghubungkan dua atau lebih piranti. Karakteristik penting sebuah bus adalah bahwa bus merupakan media transmisi yang dapat digunakan bersama.
A. Struktur dari Bus meliputi:
Ø  Bus Data : Saluran data diawali dengan Dxx Memberikan lintasan bagi perpindahan data antara dua modul system
Ø  Bus Alamat : Saluran alamat diawali dengan Axx Menandakan sumber atau tujuan data pada bus data.
Ø  Bus Kontrol : Saluran controlMengontrol akses pada saluran alamat dan penggunaan data
B. Sistem Bus Ekspansi
  1. System Bus
Adalah komponen fungsional independent dari computer yang memiliki rangkaian control yang disebut bus controller dan bus arbiter.
2.      Local Bus
Komponen ini sam dengan system bus, hanya saja bersifat local, dalam artian clock CPU dalam rangkaian pewaktu mengaturnya, diantaranya:
Ø  IBM Mikro Channel Architecture (MCA)
Ø  Video Electronics Standards Association Local Bus (VL Bus)
Ø  Peripheral Component Interconnect (PCI)
Ø  Acceleted Graphicc Port (AGP)
Bus – bus yang lain adalah:
Ø  IDE (Integrated Drive Electroniccs)
Ø  SATA ( Serial ATA)
Ø  InsiniBand

SUMBER :

http://febriansyah.blog.unas.ac.id/category/materi-kuliah/universitas-nasional/interfacing-peripheral/
http://fakti11a3.blogspot.co.id/2013/04/interfacing.html