15 December 2011

Sekilas Statistical Semantics

“Statistical semantics is the study of "how the statistical patterns of human word usage can be used to figure out what people mean, at least to a level sufficient for information access" (Furnas, 2006).”

Inilah paragraf yang mengawali teks rujukan tulisan saya. Statistical semantics menjelaskan kepada kita tentang pola penggunaan bahasa yang dapat menterjemahkan makna yang tersirat dari manusia tersebut. Berdasarkan sejarahnya istilah statistical semantics pertama kali digunakan pada tahun 1955 oleh Weaver. Ia menjelaskan bahwa dasar menterjemahkan kalimat ke dalam sebuah makna haruslah ada keterhubungan antara kata yang berdekatan.


Pada prakteknya, dalam melakukan penterjemahan makna kita tidak akan bisa melepaskan satu kata dengan kata yang lain. Karena pada prinsipnya melakukan pemaknaan adalah melihat kata per kata berdasarkan situasi. Dalam bahasa Indonesia misalnya kita mengenal adanya makna konotatif dan denotatif. Contohnya, “kebakaran jenggot” ketika kita artikan secara riil maka maknanya adalah jenggot seseorang yang terbakar. Tapi, ketika kita melihat pada situasi dan pola kalimatnya “kebakaran jenggot” juga bisa diartikan mendapatkan sesuatu yang mengejutkan. Atau pada frase “cuci tangan” juga demikian, ketika Anda menyebutkan “Kemarin saya menggunakan air untuk cuci tangan.” Maka, makna yang muncul adalah aktifitas membersihkan tangan dengan air. Namun, akan berbeda ketika melihat kalimat, “Dia cuci tangan atas tindakan pemerkosaan yang dilakukan tempo hari.” Untuk apa membersihkan tangan setelah tempo hari memperkosa orang? Disini artinya adalah melepaskan tanggung jawab. Bahwa terlihat ada suatu pola yang membedakan makna antara frase tertentu dan frase yang lain.

Terdapat beberapa variasi yang disampaikan dalam artikel ini, antara lain : mengukur kesamaan arti kata (Lund et al., 1995; Landauer and Dumais, 1997; McDonald and Ramscar, 2001, Terra and Clarke, 2003), mengukur kesamaan hubungan antar kata (Turney, 2006), pemodelan kesamaan berdasarkan generalisasi (Yarlett, 2008), penemuan kata-kata dengan melihat hubungan yang telah diberikan (Hearst, 1992), melakukan klasifikasi hubungan antara kata-kata (Turney and Littman, 2005), memunculkan kata kunci dari dokumen (Frank et al., 1999; Turney, 2000), mengukur kohesifitas dari teks (Turney, 2003), menemukan perbedaan kata (Pantel and Lin, 2002), menentukan aspek dari kata (Turney, 2001), dan pembedaan pujian dan kritik (Turney and Littman, 2003).

Hal yang perlu dilihat bahwa terdapat dua atau lebih cara melihat sesuatu kata. Jika ditarik ke ranah yang lebih luas bahwa dalam melihat sesuatu hal tidak hanya bisa dilihat dari segi dia apa adanya. Makna yang terkandung di dalamnya harus bisa diterjemahkan dengan baik sehingga maksud dari si penulis pun dapat diterjemahkan. Tulisan melalui kata-kata adalah serangkaian baris kata yang coba dituangkan oleh penulis berdasarkan pola pemikirannya. Ide dari si penulis ia transfer dalam bentuk rangkaian kata. Pembaca diminta mampu mentafsirkan kemana si penulis ingin membawa fantasi atau pikiran pembaca. Sehingga peran dari statistical semantics ini sangat diperlukan.

Tapi, patut disadari bahwa dunia ini adalah lingkaran bebas penafsiran. Bahwa saya berbeda penafsiran dengan Anda adalah hal yang lumrah. Karena tidak akan lepas dari subjektifitas manusia. Hal yang mungkin coba saya ingatkan sebagai manusia yang lemah ini adalah bahwa mari kita belajar untuk menghargai perbedaan karena dengan begitu kita tidak akan terkurung pada dimensi pribadi yang penuh keegoisan.

031211

Ditulis pertama kali di http://www.facebook.com/groups/116780403437/doc/10150592497733438/

No comments: