作者:allanneo
一、 印欧语系(Indo-European Family)
印欧语系是世界上最大的语系,亦是最为广泛研究的语系。印欧语系包含了世界上许多最重要的语言,如英语、西班牙语、法语、德语、俄语等等。这些语言是很多国家和组织的官方语言,在世界商业、科技、学术、通讯、国际会议中占有极其重要的地位。上述语言的使用者占全球总人口的一半以上。印欧语系还包含使用人数众多的语言如葡萄牙语、印地语、孟加拉语等等。关于宗教、文化、哲学方面的一些经典语言也在印欧语系中,如拉丁语、希腊语、波斯语、梵语、巴利语等。
印欧语系的语言有屈折的特性(动词、名词根据在句中的成分、作用不同而产生不同的词尾变化)。有些语言(如英语)在演变过程中丧失了很多屈折变化而变得相对简单。
印欧语系从美洲、经过欧洲,一直延伸到印度次大陆北部。一般认为原始印欧语是在新石器时代(约公元前7000年)发源于黑海北部森林地区(现在的乌克兰、立陶宛一带)。这些欧洲大陆的原始居民在公元前3500—公元前2500年间开始迁移,向西到欧洲最西端,往南到地中海,向北直至斯堪的纳维亚,往东到达印度。
(一) 凯尔特语族(Celtic Branch)
凯尔特语族是印欧语系中比较小的语族。凯尔特语早期散布在欧洲的广大地区,由于罗马人和日耳曼人的征服、民族大迁移等原因,凯尔特语的使用者被驱赶到了威尔士、爱尔兰、苏格兰等地。
凯尔特语族包括的主要语言有威尔士语(Welsh),爱尔兰盖尔语(Irish Gaelic)和苏格兰盖尔语(Scottish Gaelic)。还包括一些已经灭绝的语言,如康沃尔语(Cornish),高卢语(Gaulish),曼岛语(Manx)等。
凯尔特人的一支迁回法国,他们的语言叫做不列颠语(Breton)。
威尔士语采用“谓—主—宾”的句子结构。
(二) 日耳曼语族(Germanic Branch)
日耳曼语族发源于古诺斯语(Old Norse)和萨克逊语(Saxon)。世界上应用最广的英语(English)就是日耳曼语族的成员。英语和北海沿岸和沿海岛屿的弗里西亚语(Frisian)最为接近。它们都属于西日耳曼语支。同属该语支的还有德语(German)和荷兰语(Dutch)。荷兰语的变体有弗拉芒语(Flemish)和南非荷兰语(又译阿非利堪斯语)(Afrikaans);德语有使用希伯来字母的变体意地绪语(或称依地语、犹太德语)(Yiddish)。
北日耳曼语支(或斯堪的纳维亚语支)包括丹麦语(Danish)、挪威语(Norwegian)、瑞典语(Sweden),冰岛语(Icelandic)由于长期与大陆隔绝,较多地保留了古诺斯语的特点。与之接近的是法罗语(Faroese)。同属斯堪的纳维亚国家的还有芬兰,但芬兰语不属于印欧语系。
东日耳曼语族已经消亡,包括中欧的哥特语(Gothic)、北非的梵代尔语(Vandal)等等。
德语名词有三种性、四个格。英语已经丧失了格和性的变化。
(三) 罗曼语族(Roman Branch)
罗曼语族又称拉丁语族,全部语言都由拉丁语(Latin)演化而来。
罗曼语族包含的大语种有:法语(French)、意大利语(Italian)、西班牙语(Spanish)、葡萄牙语(Portuguese)、罗马尼亚语(Romanian)。意大利语和葡萄牙语是现存的和拉丁语最接近的语言。法语和拉丁语只是在拼写上相似,发音已经大不相同。西班牙语受阿拉伯语和巴斯克语影响较大,罗马尼亚语被斯拉夫语包围,受其影响颇深。
罗曼语族的小语种有西班牙东北部的加泰隆尼亚语(Catalan),法国南部的普罗旺斯语(Provencal),摩尔多瓦语(Moldovian)。
除拉丁语外,已经灭亡的罗曼语还有奥斯干语(Oscan)、达尔马西亚语(Dalmatian)、乌布利亚语(Umbrian)等等。
拉丁语名词有三个性、六个格,是一种高度屈折的语言,采用“主—谓—宾”的句法结构。
作者:allanneo
四) 斯拉夫语族(Slavic Branch)
斯拉夫语族处于东欧,普遍采用西里尔字母。
东斯拉夫语支包含俄语(Russian)、乌克兰语(Ukrainian)和白俄罗斯语(Byelorussian)。
西斯拉夫语支包含波兰语(Polish)、捷克语(Czech)和斯洛伐克语(Slovak)。捷克语和斯洛伐克语曾合称为波希米亚语(Bohemian)。
南斯拉夫语支包含保加利亚语(Bulgarian)、塞尔维亚语(Serbian)、克罗地亚语(Croatian)、斯洛文尼亚语(Slovene)、马其顿语(Macedonian)、波斯尼亚语(Bosnian)。中间有不属于印欧语系的匈牙利语隔开。这是我们目前为止遇到的第二个不属于印欧语系的欧洲语言。
斯拉夫语族的显著特征是复辅音发达,比如塞语叫作srpski,克语叫作hrvatski;名词的格繁多。
(五) 波罗的语族(Baltic Branch)
三个波罗的海国家有两种波罗的语言。一是立陶宛语(Lithuanian),二是拉脱维亚语(Latvia)。爱沙尼亚语和芬兰语同宗,不属于印欧语系。这是第三个不属于印欧语系的欧洲语言。
立陶宛语是印欧语系中最古老的语言之一,为研究印欧语系的起源和演化起着重要作用。
波罗的语族已经灭亡的语言是古普鲁士语(Prussian)。
(六) 希腊语
希腊语(Greek)自成一支。现代希腊语(Modern Greek)是标准语克伊内语(Koine)的后裔。
荷马史诗所用的希腊语称作古希腊语,和现代希腊语有诸多不同。
希腊语名词有三性四格,使用独特的希腊字母。该字母表由腓尼基字母演变而来,是世界上最古老的字母之一。拉丁字母和西里尔字母都是由希腊字母演变而来。
(七) 阿尔巴尼亚语
阿尔巴尼亚语(Albanian)区位于亚得里亚海之东,塞尔维亚—克罗地亚语区之南。其本身的核心词汇显示出它是印欧语系的一个独立分支。
(八) 亚美尼亚语
在小亚细亚有印欧语系的另一单独分支—亚美尼亚语(Armenian)(旧译阿尔明尼亚语)。该语言辅音发达,有很多波斯语借词。
(九) 印度—伊朗语族(Indo-Iranian Branch)
印欧语系在亚洲的大分支叫做印度—伊朗语族。它由伊朗语支和印度语支组成。
伊朗语支由古波斯语(Ancient Persian)演化而来。最早的文献是波斯王国的大流士一世时的碑铭,及已经灭绝的阿维斯坦语(Avestan)写的圣经。
伊朗语支现存的主要语种有波斯语(Farsi)、库尔德语(Kurdish)。向东有阿富汗的普什图语(Pushtu),向西有高加索地区的奥塞梯语(Ossete/Ossetian)、塔吉克斯坦的塔吉克语(Tadzhik)。
印度语支包含语言数目众多,多由梵语(Sanskrit)演化而来。梵语是古代印度的标准语言,是文学、艺术、学术著作的语言。巴利语(Pali)是古代印度些佛经的语言。
现代的印度语支语言中,比较重要的有印地语(Hindi)、乌尔都语(Urdu)、尼泊尔语(Nepali)、孟加拉语(Bengali)和僧伽罗语(Singhalese)。其中印地语、尼泊尔语、孟加拉语使用天城体文字或其变体。乌尔都语是巴基斯坦的国语,由于其国民为穆斯林,所以使用阿拉伯文字。僧伽罗语是斯里兰卡的国语,使用源自巴利文的特殊文字。
印度语支方言众多,其中使用人数较多的有以下这些语言:马拉蒂语(Marathi)、古吉拉特语/鸠遮拉特语(Gujerati)、旁遮普语(Punjabi)、拉贾斯坦语(Rajasthani)、奥里亚语(Oriya)、克什米尔语(Kashimiri)、信德语(Sindhi)、比哈里语(Bihari)、阿萨姆语(Assamese)等等。
除此之外,印度语支还有马尔代夫语(Maldivian)、吉普赛语(Romani)等等。
印度南部语言如泰米尔语并不属于印欧语系。举例来说,印度北方的印地语和英、法、希腊语更为接近,而和印度南方语毫无关联。
(十) 吐火罗语、赫梯语
根据在中国新疆发现的公元六世纪的手稿,人们知道了中亚有吐火罗语(Tocharian/Tokharian)。吐火罗人是文化程度很高的民族,公元一千年左右为维吾尔人所败,其后消失。
赫梯语(Hittite)是小亚细亚的古代语言,存有楔形文字铭文。
作者:allanneo
二、 汉藏语系(Sino-Tibetan Family)
按使用人数来算,汉藏语系是仅次于印欧语系的第二大语系。它包括世界上使用人数最多的语言—汉语官话。
汉藏语系一般归为四个语族,即汉语族、藏缅语族、侗台语族和苗瑶语族。关于汉藏语系的分类和归属,学术界一直有争论。西方一些学者一般认为侗台和苗瑶不属于汉藏语系,而属于南亚语系。本文从大多数中国大陆学者及部分西方学者的观点,将它们纳入汉藏语系。
汉藏语系的语言一般是由单音节字组成的声调语言。词由单个音节的字组成,每个音节都有声调。汉语北方话有四个声调,泰语有五调,粤语有九调。很多语言是孤立语,使用虚词和语序作为表达语法意义的主要手段。
(一) 汉语族(Sinitic Branch)
汉语族包含中国境内汉民族使用的多种语言,即汉语官话(Mandarin)、吴语(Wu)、粤语(Cantonese)、闽语(Min)、赣语(Gan)、湘语(Xiang)、客家语(Hakka)。这些语言使用约五万多汉字,常用汉字约六千个。
(二) 藏缅语族(Tibeto-Burman Branch)
藏缅语族的大语种有藏语(Tibetan)、缅甸语(Burmese);小语种有中国南部的彝语(Yi)、傈僳语(Lisu)、拉祜语(Lahu),缅甸的克伦语(Karen),不丹的宗卡语(Jonkha),尼泊尔的内瓦里语(Newari)等等。
这些语言使用的文字大多来源于印度文字。
(三) 侗台语族(Tai Branch)
又称侗泰语族、侗傣语族或壮侗语族。包括泰语(Thai)、老挝语(Laos),中国的壮语(Zhuang)、布依语(Puyi)、侗语(Tung)、怒语(Nu)等等。
(四) 苗瑶语族(Miao-Yao Branch)
主要包括中国少数民族的苗语(Miao)、瑶语(Yao)、畲语(She)。
作者:allanneo
三、 闪含语系(Semitic-Hamitic Family)
闪含语系也称“亚非语系”或“阿非罗—亚细亚语系”(Afro-Asiatic Family),主要分布在亚洲的阿拉伯半岛和非洲的北部。闪含语系的名称是从圣经的传说中挪亚的两个儿子的名字来源的。圣经说挪亚的儿子闪是希伯来人的祖先,含是亚述人和非洲人的祖先。
闪含语系的主要共同特征是:辅音除了清辅音、浊辅音外,还有一种重辅音,在口腔后部和喉腔形成,又叫喉音。名词有格和性,但比印欧语系简单。阿拉伯和希伯来字母只有辅音,元音用附加上辅音上的符号表示。书写时一般也只写辅音,读者需要从语境中判断出正确的元音。
(一) 闪语族(Semitic Branch)
阿拉伯语(Arabic)是闪语族中重要的成员。它是很多伊斯兰国家的宗教、文学、以及官方的语言,也是联合国六种工作语言之一。
马耳他是天主教国家,马耳他语(Maltese)使用拉丁字母,但属于闪语族。
闪语族另一重要语言是希伯来语(Hebrew)。它是犹太教的语言,也是旧约圣经最早的手抄本使用的语言。希伯来语使用自己的一套特殊字符,作为口语曾经消亡过一段时间,后来被人为恢复为口语,现在是以色列的国语。
同属闪语族的还有埃塞俄比亚的阿姆哈拉语(Amharic)、亚述王朝的阿卡德语(Akkadian)、亚述语(Assyrian)。
最后要提到的是阿拉米语(Aramaic),它曾经是波斯王朝的主要官方语言,扩展于中东、近东的广大地区,与希腊语竞争,取代了希伯来语、亚述语等许多其它语言。后来由于阿拉伯语的扩张而被排挤,现存于叙利亚、伊拉克、土耳其和伊朗的孤立小块地区。
(二) 埃及语族(Egyptian Branch)
这是一个已经灭绝了的语族,包括公元前四千年古埃及的象形文字,及后期的使用近似希腊字母文字的科普特语(Coptic)。十七世纪,埃及语灭亡,被阿拉伯语所取代。
(三) 贝贝尔语族(Berber Branch)
贝贝尔语族位于北非山地,代表语言有特哇力语(Tuareg)、卡比勒语(Kabyle)、塔马舍克语(Tamazight)等。它们在非洲北部抵挡住了阿拉伯语的进攻。
(四) 库施特语族(Cushite Branch)
主要分布于埃塞俄比亚、厄立特里亚、苏丹和索马里。包括索马里语(Somali)、加拉语(Galla)、贝扎语(Beja)等等。
(五) 乍得语族(Chadic Branch)
乍得语族包括尼日利亚、乍得和喀麦隆地区使用的约600种语言。其中最主要的是豪萨语(Hausa),它是尼日利亚的主要语言,从前使用阿拉伯字母,现在采用拉丁字母。
埃及语族、贝贝尔语族、库施特语族和乍得语族可合称“含语族”(Hamitic Branch)。
作者:allanneo
四、 乌拉尔语系(Uralic Family)
前面提到,有三种欧洲语言不属于印欧语系:芬兰语、匈牙利语和爱沙尼亚语。它们属于乌拉尔语系。
乌拉尔语的原始居民在大约1500年前从乌拉尔山脉的西伯利亚一侧迁入欧洲,生活习俗已经完全欧洲化,但语言仍然保存了原来的面貌。
乌拉尔语系分为两个大语族:芬兰—乌戈尔语族和萨莫耶德语族。
(一) 芬兰—乌戈尔语族(Finno-Ugric Branch)
该语族分为两个语支。芬兰语支包括十分相似的芬兰语(Finnish)和爱沙尼亚语(Estonian),以及西伯利亚的莫尔多维亚语(Mordvin)、乌德穆尔特语(Udmurt)、科米语(Komi)等小语种。
乌戈尔语支包括匈牙利语(Hungarian)及与之相近的处于中西伯利亚的奥斯恰克语(Ostyak)、沃古尔语(Vogul)。
(二) 萨莫耶德语族(Samoyed Branch)
在叶尼塞河沿岸约有一万八千人说萨莫耶德语族的语言,如塞尔库普语(Selkup)、涅涅茨语(Nenets)、牙纳桑语(Nganasan)、埃内茨语(Enets)等等。
乌拉尔语系诸语言比前面几个语系的语言更为屈折,词尾后缀变化丰富。芬兰语名词有15个格,匈牙利语有17个!一些常见的国名在这些语言里变得不再熟悉,例如芬兰语中的“芬兰”、“德国”、“法国”分别叫做Suomi,Saksa,Ranska,与Finland,Germany,France相去太远。
作者:allanneo
五、 阿尔泰语系(Altaic Family)
阿尔泰语系由中亚的阿尔泰山得名,现在主要分布在中国、蒙古、土耳其以及一些中亚国家。使用阿尔泰语系各种语言的人民早期是中国北方的游牧民族。匈奴、乌桓、鲜卑、突厥、契丹、女真、蒙古、满各个民族在这一地区直至西亚和东欧都曾建立国家。由于统治权不稳定、战争、迁移等原因,居民流动性很大,和其它语言接触很多,阿尔泰语言发展历史就比较复杂。
阿尔泰语系分为突厥、蒙古、满—通古斯三个大语族。
(一) 突厥语族(Turkic Branch)
突厥语族中的土耳其语(Turkish)是阿尔泰语系最西边、使用人口最多的一种语言。很多前苏联的加盟共和国的语言也都是突厥语族的成员,如阿塞拜疆语(Azeri)、土库曼语(Turkmen)、哈萨克语(Kazakh)、吉尔吉斯语(Kirghiz)、乌兹别克语(Uzbec);另外还有鞑靼语(Tatar)、维吾尔语(Uygur)、巴什基尔语(Bashkir)等语种。中国境内的有些少数民族的译法略有不同:“乌兹别克族”译为“乌孜别克族”;“吉尔吉斯族”译为“柯尔克孜族”;“鞑靼族”译为“塔塔尔族”。
(二) 蒙古语族(Mongolian Branch)
蒙古语(Mongolian)使用于蒙古人民共和国和中国北方的蒙古族。蒙古国使用西里尔字母,中国的蒙古族仍然使用一种竖写的拼音文字。
蒙古语族的小语种有布利亚特语(Buryat),卡尔梅克语(Kalmyk)。
(三) 满—通古斯语族(Manchu-Tungusic Branch)
这个语族包括西伯利亚地区的埃文基语(Evenki),或通古斯语(Tunguse),以及满语(Manchu)、锡伯语(Sibo)等。但中国境内的满族人大都只能说汉语。
早期曾经把乌拉尔语系和阿尔泰语系并称为“乌拉尔—阿尔泰语系”。后来经深入研究发现更多相异特性,不应合并为同一语系。
另外有的语言学家主张把日语(Japanese)和朝鲜语(Korean)也划入阿尔泰语系,因为它们和阿尔泰语言确有共同特质。但大量相异成分又难于解释,因此也有很多人认为它们属于阿尔泰语系只是假说。还有很多人认为日语、朝鲜语语系归属未定,或自成一支。关于日语、朝鲜语的划分问题,至今未有定论。
日语使用汉字及两套假名。朝鲜语过去使用汉字,现用一套600多年前其独创的一种拼音文字系统。日语和朝鲜语的敬语发达,根据说话者和说话对象的地位不同,采取不同的词汇或敬语形式。另外日语中不同性别的人用词也有差异。
阿尔泰语系,包括日语、朝鲜语都是典型的黏着语(粘着语):以在词根后加构词附加成分为派生新词的主要手段,以在词干之后加语法粘附成分为形态变化的主要手段。
在语音结构上,阿尔泰语系的语言,包括朝鲜语,都有“元音和谐”的特性。所谓元音和谐是指,元音根据发音位置前后不同分为阳性、阴性两类,在同一个词里要么都是阳性元音,要么都是阴性元音。例如,土耳其语构成复数的词尾有两种:-lar和-ler。at(马)构成复数为atlar;而ev(房子)的复数为 evler。
作者:allanneo
六、 高加索语系(Caucasian Family)
高加索语系由黑海和里海之间的高加索山脉得名。其南支的卡尔特维里语族(Kartvelian Branch)中最主要的语言是格鲁吉亚语(Georgian),其它语言还有明格雷利亚(Mingrelian)、拉兹语(Laz)、斯凡语(Svan)。西北支的阿布哈兹—阿第盖语族(Abkhaz-Adyghean Branch)主要包括阿布哈兹语(Abkhaz)、阿第盖语(Adyghe)、卡巴尔达语(Kabardian)、阿巴兹语(Abaza)等等。东北地区主要有车臣语(Chechen)、印古什语(Ingush)、达吉斯坦语(Daghestanian)、阿瓦尔语(Avar)、莱兹金语(Lezgin)、拉克语(Lak)、列兹吉语(Lezgi)、塔巴萨兰语(Tabasaran)等。
高加索语言的普遍特点是存在大量复杂的辅音簇。有种已消亡的高加索语言包含多达81个单个辅音。俄罗斯南方的卡巴尔达语只有3个元音,而且在实际话语中常常消失。很难想象人们说话都是辅音是什么样子,也许由于地处高寒地区,人们有意避免张口发元音,以提高语速并减少热量损失。
作者:allanneo
七、 南岛语系(Austronesian Family)
或称“马来—玻利尼西亚语系”(Malayo-Polynesian Family)。该语系从印度洋、马来半岛、东南亚,越过太平洋直到复活节岛,由一千多种语言组成。该语系的使用者据说最早起源于黄河谷地,公元前 2500年左右经台湾迁移到菲律宾,公元前约1000年进一步迁至印度尼西亚、太平洋诸岛屿。南岛语系包括五个分支:
(一) 台湾语族(Formosan Branch)
包括台湾本土的阿美语(Amis)、泰雅语(Atayal)、排湾语(Paiwan)、邹语(Tsou)。这些语言的使用者都是台湾原住民。
(二) 印度尼西亚语族(Indonesian Branch)
又称马来语族,是南岛语系最大的一支。其中的马来语(Malay)作为一种贸易和文化的语言在许多地方使用。马来语曾使用阿拉伯字母,20世纪改用拉丁字母。
该语族还包括印度尼西亚的诸多语言如印尼语(Indonesian)、爪哇语(Javanese)、巽他语(Sundanese)、马都拉语(Madurese)、巴厘语(Balinese)等等;及许多菲律宾语言,如比萨亚语(Visayan)、他加禄语(Tagalog)等。
此外还有一个遥远的分支叫做马尔加什语(Malagasy),它是非洲南部岛国马达加斯加的国语。1500年前,一部分人从印度尼西亚渡过印度洋来到马达加斯加岛。他们尽管已成为非洲人,风俗习惯也变得非洲化,但语言仍然表现南岛语的特点。
(三) 密克罗尼西亚语族(Micronesian Branch)
包括较小地区的语言,如马绍尔群岛语(Marshallese)、吉尔伯特群岛语(Gilbertese)、雅浦岛语(Yapese)、瑙鲁语(Nauruan)等等。
(四) 美拉尼西亚语族(Melanesian Branch)
包括斐济语(Fijian)、所罗门群岛语(Solomonese)等。
(五) 玻利尼西亚语族(Polynesian Branch)
包括新西兰的毛利语(Maori)以及太平洋中靠东面的一些岛屿的语言,如萨摩亚群岛语(Samoan)、塔希提岛语(Tahitian)、夏威夷语(Hawaiian)、复活节岛语(Rapa Nui)等。
不难发现这些语族名称普遍带有-nesian词根。从字面意思看,Austronesian意为“南岛”;印度尼西亚(Indonesian)意为“印度岛”;密克罗尼西亚(Micronesian)意为“小岛”;美拉尼西亚(Melanesian)意为“黑岛”;玻利尼西亚(Polynesian)意为 “群岛”。
南岛语系语言的名词、动词形式变化很简单。马来语没有时态或格的变化。复数通过重复词根完成,如anak:小孩;anak anak:孩子们。
太平洋诸语中代词变化复杂。物主代词“我们/我们的”在有的太平洋语言中要细分为“暂时性属于”(如汽车、书本),和“永久性属于”(如身体器官)。有的语言的指示代词“这”分为三种变化,一种指示看得见的物体;一种用来指示说话时看不到但存在的物体;一种指示不存在的事物。还有的语言中的人称代词“我们”分为“包括说话对象”和“不包括说话对象”两种。美拉尼西亚语的复数人称代词还有三种数的变化:双数aijumrau(我们俩);三数 aijumtai(我们仨);复数aijam(我们)。
太平洋语言另一特点是辅音、元音数量较少。夏威夷语仅有8个辅音(H、K、L、M、N、P、W、喉塞音)和五个元音(A、E、I、O、U)。
他加禄语和毛利语采用“谓—主—宾”的语法形式。马尔加什语为“谓—宾—主”。
作者:allanneo
八、 南亚语系(Austroasiatic Family)
南亚语系分布在印度东部至中南半岛的亚洲东南部地区。一般分为三个语族。
(一) 越芒语族(Viet-Muong Branch)
该语族包括越南语(Vietnamese)、芒语(Muong)(两者都是越南境内的语言)。中国境内的京语(Jing)实际上也就是越南语。
(二) 孟—高棉语族(Mon-Khmer Branch)
该语族主要包括孟语(Mon),曾经的泰王国的主要语言,现在使用于缅甸、泰国、中国和越南的零星地区;高棉语(Khmer),柬埔寨的国语;尼科巴语(Nicobarese),位于苏门答腊西北的尼科巴群岛;卡西语(Khasi);中国境内(主要云南省)的佤语(Wa)、布朗语(Blang)、德昂语(De’ang)等。
(三) 扪达语族(Munda Branch)
扪达语族语言零星分布于印度北部地区,包括扪达语(Munda)、科尔库语(Korku)等近20种语言。
南亚语系中越南语具有声调,其余语言没有声调。前面汉藏语系中提到,有学者认为“侗台”和“苗瑶”两个语族属于南亚语系。
作者:allanneo
九、 达罗毗荼语系(Dravidian Family)
在前文“印欧语系”中提到,印度北部语言大多属于印欧语系,但南部语言与北部差距甚远。印度南方大部的语言属于达罗毗荼语系。该语系的一显著特点是发音难度大。
达罗毗荼语系包括的大语种有泰米尔语(Tamil),使用者约一千八百万人,分布于印度的泰米尔省、斯里兰卡北部、马来西亚,同时也是新加坡的四种国语之一;马来雅兰语(Malayalam),约有六百万人使用;泰卢固语(Telugu),约二千四百万人使用,分布于印度东南沿海马德拉斯以北的地区;卡拿拉语(Canarese),约一千万人使用于孟买地区的卡拿拉。这些语言使用各自的书写系统,具有弯曲、圆弧形的典型南印文字特征。
另有一种达罗毗荼语叫做婆罗灰语(Brahui),有十七万人使用,在俾路支山区。
达罗毗荼语普遍具有卷舌辅音(一称顶音),该特征是受印欧语系的印度语族语言影响而来。发这种音时,舌面卷起,舌尖抵住硬腭。这也是印度境内诸语的显著特征。另外,达罗毗荼语多表现黏着特征,名词格的变化复杂。
一般认为达罗毗荼语系发源于现在巴基斯坦境内的印度河谷,曾经覆盖过整个印度次大陆。