Artikel leksikostatistik

LEKSIKOSTATISTIK
Bahasa menjadi ciri identitas suatu bangsa. Melalui bahasa, orang dapat mengidentifikasi kelompok masyarakat, mengenali perilaku, dan kepribadian masyarakat penuturnya. Selain sebagai alat komunikasi, bahasa menurut Kridalaksana (1983:21) merupakan sistem lambang bunyi yang arbitrer yang digunakan oleh para anggota kelompok sosial untuk bekerja sama, berkomunikasi, dan mengidentifikasikan diri. Indonesia memiliki berbagai macam suku atau etnik yang tersebar di tanah air. Tiap etnik mempunyai bahasa masing-masing yang digunakan dalam komunikasi baik sesama etnik maupun antaretnik. Sebagai salah satu unsur kebudayaan yang peranannya sangat penting, bahasa merupakan sarana komunikasi untuk menyampaikan maksud dan pokok pikiran manusia serta mengekspresikan dirinya di dalam interaksi kemasyarakatan sehingga mampu mengikuti perkembangan. Menurut Parera (1991:187) terdapat 5.445 bahasa di dunia. Dari jumlah itu sebagian bahasa terdapat di Indonesia. Data Summer Institute of Linguistic (2006) menunjukan adanya 741 bahasa daerah di Indonesia.
Bahasa muncul dan berkembang akibat adanya interaksi antarindividu dalam suatu masyarakat. Selain untuk mengekspresikan diri, bahasa juga digunakan sebagai alat integrasi dan adaptasi sosial antarmanusia dalam mengembangkan peradabannya. Jakobson dalam Chaer menyatakan bahasa bersifat dinamis karena dalam bahasa terdapat perubahan suatu kata atau bertambahnya bahasa baru berdasarkan tujuan tertentu 2004: 16). Pada awalnya perubahan bahasa hanya dianggap sebagai variasi bahasa, pencampuran yang tumpang tindih, dan bahkan dianggap tidak dapat diamati. Namun, perkembangan dan perubahan bahasa terus menerus terjadi sehingga terdapat cabang ilmu bahasa yang mempelajarinya. Cabang ilmu bahasa ini mempelajari perkembangan bahasa dari satu masa ke masa lain dan mengamati perubahan serta mencari tahu sebab akibat perubahan bahasa tersebut. Cabang ilmu bahasa ini adalah linguistik historis komparatif.
Linguistik historis komparatif menurut Keraf adalah cabang ilmu bahasa yang mempersoalkan bahasa dalam bidang waktu serta perubahanperubahan unsur bahasa yang terjadi dalam bidang waktu tersebut (1984:22). Verhaar (dalam Suhardi, 2013:25) menyatakan
kajian linguistik historis komparatif ini dapat dikelompokkan ke dalam kajian linguistik sinkronis dan linguistik diakronis. Metode historis komparatif dapat diterapkan pada bahasa yang telah memiliki naskah tulis dengan aksaranya dan pada bahasa lisan yang belum mengenal sistem tulis atau aksara. Untuk dapat melakukan satu telaah historis komparatif yang cermat, maka pada awalnya harus memiliki naskahnaskah tertulis dari dua atau lebih bahasa yang hendak dibandingkan secara historis dengan tujuan tertentu, yakni perumpunan bahasa, penemuan, dan prekonstruksian bahasa purba yang menurunkan bahasa-bahasa tersebut, dan mungkin menentukan arah sebaran serta tahun pisah bahasa-bahasa tersebut. Makin tua sebuah naskah, makin terandalkan atau terpercaya hasil rekonstruksi bunyi atau bahasa tersebut. Bahasa-bahasa yang ada bisa dibandingkan kekerabatannya, baik itu bahasa bahasa indonesia dengan bahasa daerah atau bahasa daerah tertentu dengan bahasa daerah lainnya.
Leksikostatistik adalah suatu teknik yang memungkinkan kita untuk menentukan tingkat hubungan di antara dua buah bahasa, dengan menggunakan cara yang paling mudah, yaitu dengan membandingkan kosa kata pada bahasa-bahasa tersebut yang kemudian dapat dilihat dan ditentukan tingkat kesamaan di antara kosa kata kedua bahasa (Crowley: 1992:168). Dengan demikian, sejauh mana hubungan kekerabatan satu bahasa dengan bahasa lainnya dapat diketahui. Menurut Crowley (1987: 191—192), metode leksikostatistik beroperasi di bawah dua asumsi dasar. Asumsi pertama ialah bahwa beberapa bagian kosakata dari sebuah bahasa sukar berubah daripada bagian lainnya. Apa yang dimaksud dengan kosakata yang sukar berubah adalah kosakata dasar, yakni kata-kata yang sangat intim dalam kehidupan bahasa, dan merupakan unsur-unsur yang menentukan mati hidupnya suatu bahasa (lihat juga Keraf, 1991: 123). Kemudian, istilah ‗perubahan‘ mengacu pada penggantian sebuah kata dengan sebuah kata nonkerabat karena bentuk asli berubah maknanya sehingga kemunculannya merujuk kepada sesuatu yang lain, atau karena sebuah kata dipinjam dari bahasa lain untuk mengekspresikan makna tertentu. Asumsi kedua ialah bahwa perubahan kosakata dasar pada semua bahasa adalah sama. Asumsi ini telah diuji pada 13 bahasa, di antaranya bahasa yang memiliki naskahnaskah tertulis. Hasilnya menunjukkan bahwa dalam tiap 1.000 tahun, kosakata dasar suatu bahasa bertahan antara 86,4— 74,4 %, atau dengan angka rata-rata 80,5%. Tentu saja hal itu tidak dapat diartikan bahwa semua bahasa akan bertahan dengan persentase rata-rata tersebut, karena semua bahasa yang digunakan dalam eksperimen itu (kecuali dua bahasa) adalah bahasa-bahasa Indo-Eropa. Bila asumsi kedua diterima, retensi rata-rata kosakata dasar suatu bahasa dalam tiap 1.000 tahun dapat dinyatakan dalam rumus: 80,5% x N. Simbol N adalah jumlah kosakata dasar yang ada pada awal
kelipatan 1.000 tahun yang bersangkutan. Dari 200 kosakata dasar (N) suatu bahasa sesudah 1.000 tahun pertama akan tinggal 80,5% x 200 kata = 161 kata. Sesudah 1.000 tahun kedua akan tinggal 80,5% x 161 kata = 139,6 kata atau dibulatkan menjadi 140 kata. Sesudah 1.000 tahun ketiga kosakata dasarnya tinggal 80,5 x 140 kata = 112,7 atau dibulatkan menjadi 113 kata, dan seterusnya. ―Leksikostatistik adalah metode pengelompokan bahasa yang dilakukan dengan menghitung prosentase perangkat kognat/kerabat (Mahsun,1995:115)‖. Dalam penghitungan leksikostatistik, kata-kata yang memiliki kemiripan dari segi fonetis atau morfologi akan dianggap sebagai kata yang berkerabat atau dikenal dengan istilah kognat (cognate). Melalui kata-kata berkerabat inilah dilakukan penghitungan waktu pisah dari bahasa protonya atau usia bahasa.

Dalam klasifikasi leksikostatistik, kesamaan pada tingkat 81-100% disebut bahasa, kesamaan pada tingkat 36—81% disebut keluarga, kesamaan pada tingkat 1236% disebut rumpun, kesamaan pada tingkat 4-12% disebut mikrofilum, kesamaan pada tingkat 1-4% disebut mesofilum, dan kesamaan pada tingkat 0-1% disebut makrofilum. Namun, perlu dicatat bahwa ahli bahasa yang berbeda adakalanya menggunakan hitungan yang berbeda. Keraf (1991: 127—130) mengatakan bahwa dalam membandingkan kata-kata untuk menetapkan kata-kata kerabat dan kata-kata nonkerabat terdapat asumsi bahwa fonem bahasa proto yang berkembang secara berlainan dalam bahasa-bahasa kerabat akan berkembang secara konsisten dalam lingkungan linguistis bahasa kerabat masingmasing. Dalam perbandingan itu, fonemfonem dalam posisi relatif sama dibandingkan satu sama lain. Bila terdapat hubungan genetis, pasangan fonem tersebut akan timbul kembali dalam banyak pasangan lain. Tiap pasangan yang sama yang timbul dalam hubungan itu merupakan pantulan suatu fonem atau alofon dalam bahasa protonya (lihat juga Crowley).
DAFTAR PUSTAKA
Crowley, T. 1992. An Introduction to Historical Linguistics. Oxford: Oxford University Press.
Keraf, Gorys. 1984. Linguistik Bandingan Historis. Jakarta: Gramedia Pustaka Utama.
Keraf, Gorys. 1991. Linguistik Bandingan Tipologis. Jakarta: Gramedia Pustaka Utama.
Kridalaksana, Harimurti. 1963. ―Perhitungan Leksikostatistik atas Delapan Bahasa Nusantara Barat serta Penentuan Pusat Penyebaran Bahasa-Bahasa itu Berdasarkan Teori Migrasi‖. dalam Majalah Ilmu-Ilmu Sastra 1963-1973. Jakarta.
Kridalaksana, Harimurti. 2008. Kamus Linguistik. Jakarta: PT Gramedia Pustaka Utama.
Mahsun. 1995. Dialektologi Diakronis: Sebuah Pengantar. Yogyakarta: Gadjah Mada University Press.
Parera, Jos Daniel.1991. Kajian Linguistik Umum Historis Komparatif. Jakarta:Erlangga.
Suhardi. (2013). Pengantar Linguistik Umum. Yogyakarta: Ar-Ruzz Media.