Leksikostatistik merupakan teknik pengelompokan bahasa yang lebih cenderung mengutamakan perhitungan leksikon (kata-kata) secara statistik, untuk kemudian berusaha menetapkan pengelompokan itu berdasarkan persentase kesamaan suatu isolek bahasa dengan bahasa lain. Terdapat empat macam asumsi dasar yang digunakan sebagai titik tolak dalam usaha mencari jawaban mengenai usia bahasa. Pertama, sebagian dari kosa kata suatu bahasa sukar sekali berubah bila dibandingkan dengan bagian lainnya. Kedua, retensi (ketahanan) kosa kata dasar adalah konstan sepanjang masa. Kegita, perubahan kosa kata dasar pada semua bahasa adalah sama. Keempat, bila presentase dari dua bahasa kerabat (cognate) diketahui, maka dapat dihitung waktu pisah kedua bahasa tersebut.
Menerapkan keempat asumsi dasar diatas, maka perlu diambil langkah-langkah tertentu. Langkah-langkah tersebut sekaligus merupakan teknik-teknik metode leksikostatistik. Terdapat empat langkah yang sangat diperlukan sebagai berikut:
a.Mengumpulkan kosa kata dasar
Unsur yang paling penting dalam membandingkan dua bahasa atau lebih adalah mengumpulkan daftar kosa kata dasar dari bahasa-bahasa yang akan di teliti. Daftar yang baik adalah daftar yang disusun oleh Morris Swadesh yang berisi 200 kata. Swadesh sendiri kemudian telah mengusulkan suatau daftar kata yang terdiri dari 100 kata. Alasanya adalah bawah dalam daftar yang lama ada beberapa kata yang tidak universal seperti: es, salju, membeku. Terlepas dari kelemahan itu, adalah suatu kekeliruan untuk menyusun suatu daftar yang lebih singkat, karena semakin singkat suatu daftar, semakin besar pula peluang untuk membuat kesalahan. Apalagi sering tidak mungkin untuk mendapatkan kata bagi setiap gloss dalam daftar tersebut. Sebab itu ada beberapa ahli yang menyangsikan hasil yang akan dicapai dengan daftar yang terdiri dari 100 kata.
b.Menghitung kata kerabat
Pada saat membandingkan kata-kata untuk menetapkan kata-kata mana yang merupakan kata kerabat dan mana yang tidak, maka perlu dikemukakan lagi suatu asumsi lain dalam metode perbandingan yaitu fonem bahasa proto yang sudah berkembang secara berlainan dalam bahasa-bahasa kerabat akan berkembang terus secara konsisten dalam lingkungan linguistis masing-masing bahasa kerabat.
c.Menghitung waktu pisah
Penetapan waktu pisah ditentang terhadap teori Stambaum A. Scheleiher. Suatu porsentase bahasa kerabat tidak hanya ditetapkan dengan satu waktu, akan tetapi harus terjadi berangsur-angsur, maka harus ditetapkan suatu jangka waktu perpisahan itu terjadi untuk menghindarkan kesalahan semacam itu.
d.Menghitung jangka kesalahan
Cara yang biasa dipergunakan untuk menghindari kesalahan dalam statistik adalah memberi suatu perkiraan bahwa suatu hal terjadi bukan dalam waktu tertentu, tetapi dalam jangka waktu tertentu. Dalam jangka waktu itu terjadi akumulasi perbedaan-perbedaan antara kedua bahasa itu yang sekian hari bertambah besar. Sehingga perlahan-lahan menandai perpisahan antara kedua bahasa tersebut.
Data-data hasil kajian leksikostatistik memberikan tingkat perkembangan bahasa-bahasa dan dialek-dialek. Didapatkan melalui pengkajian sejumlah bahasa dan dialek, maka pasangan kosakata yang menunjukkan angka perpisahan yang tinggi mempunyai arti bahwa pencabangan bahasa tersebut berlangsung pada waktu yang lebih tua. Sedangkan pasangan yang menunjukkan angka perpisahan kecil berarti bahwa pencabangan bahasa baru saja terjadi. Selain itu, data leksikostatistik dapat mengandung lokasi geografis, seperti kontak-kontak kebudayaan pada dialek-dialek proto. Walaupun eksperimen-eksperimen memungkinkan adanya kecermatan yang lebih besar dalam pencapaian usia dan kekerabatan antara bahasa, harus diingat bahwa tidak ada ilmu yang khusus yang lebih teliti daripada yang tersedia dan kecermatan menemukan kata-kata kerabat.