Metode Pengelompokan Leksikostatistik

Bahasa merupakan ciri khas suatu bangsa. Melalui bahasa, manusia dapat mengidentifikasi kelompok masyarakat tertentu. Suku dan budaya di Indonesia ada berbagai macam yang tersebar di tanah air. Bahasa masing-masing suku yang digunakan dalam berkomunikasi pun berbeda.

Istilah leksikostastistik dikenal juga istilah lain yaitu glotokronologi (Glottochronology). Leksikostatistik merupakan suatu teknik pengelompokan bahasa yang mengutamakan peneropongan kata-kata (leksikon) secara statistik, kemudian menetapkan pengelompokan tersebut berdasar prosentase kesamaan dan perbedaan suatu bahasa dengan bahasa lain. Sedangkan glotokronologi merupakan teknik linguistik historis yang berusaha mengadakan pengelompokan dengan mengutamakan perhitungan waktu (time depth) atau perhitungan usia bahasa-bahasa kerabat. Dengan demikian, leksikostatistik dan glotokronologi dapat dibatasi sebagai suatu teknik yang berusaha menemukan kekurangan-kekurangan (data-data) untuk suatu tingkat waktu, guna menentukan usia bahasa dan pengelompokan bahasa-bahasa. Dapat disimpulkan bahwa yang akan dicapai dalam teknik ini merupakan kepastian mengenai usia bahasa mengenai kapan sebuah bahasa muncul, dan hubungan dengan bahasa-bahasa kerabat.

Terdapat 4 asumsi dasar leksikostatistik. Untuk menerapkan keempat asumsi tersebut, maka perlu adanya langkah-langkah tertentu. Langkah pertama yaitu mengumpulkan kosakata. Langkah yang kedua yaitu menghitung kata kerabat. Kemudian langkah ketiga yaitu menghitung waktu pisah. Menghitung jangka keselahan merupakan langkah keempat. Pada metode statistik dikembangkan cara tertentu untuk menghitung jangka kesalahan yang mungkin timbul dalam perhitungan tersebut.

Metode leksikostatistik atau glotokronologi bukan hanya metode untuk menentukan waktu pisah dua bahasa kerabat, tetapi juga metode untuk mengadakan pengelompokan bahasa-bahasa kerabat. Setelah mengetahui waktu pisah antara bahasa-bahasa kerabat berdasarkan kata-kata kerabatnya sudah tersirat pengelompokan tersebut. Bahasa yang memperlihatkan persentase kekerabatan tinggi merupakan kelompok yang lebih dekat keanggotaannya, sedangkan yang prosentase kekerabatannya rendah merupakan bahasa yang agak jauh kekerabatannya dan termasuk dalam kelompok yang lebih besar.

Morris Swadesh menyusun sebuah daftar kosakata dasar yang terdiri dari dua ratus kata yang dianggapnya bersifat universal. Kata-kata tersebut dipakai dalam pengujian untuk menentukan untuk menentukan bahasa-bahasa kerabat. Pada daftar I, daftar kosakata dasar, diambil dari artikel Gudschinsky. Namun terdapat beberapa kata yang tidak bersifat universal maka, diadakan penyesuaian dengan mengeluarkan lima kata (bark, freeze, ice, leg, snow) digantikan dengan kata: bulan, kuku, lelek, sayap dan lutut. Daftar II menekankan situasi geografis wilayah Austronesia. Daftar ini disusun dengan memasukkan juga kata-kata yang digunakan oleh Prof. Dr. N.H. Kern dalam menentuan negeri asal bahasa Austronesia.