Den viktigaste förutsättningen för det mänskliga språket ligger i hjärnan, som har flera genetiskt bestämda strukturer som specifikt betjänar språket. Talet bygger i hög grad på ett utvecklat samspel mellan främst struphuvud, tunga och läppar. Ändå är den mänskliga språkförmågan ingalunda bunden till talapparaten. Detta framgår av att personer som fötts döva, och som därför aldrig hört hur talat språk låter, trots detta kan lära sig dövas teckenspråk med jämförbar uttrycksfullhet.

Talet skall inte bara produceras utan också uppfattas och tolkas. De enskilda orden skall kopplas till motsvarande företeelser i individens erfarenhet, och kombinationer av enskilda ord skall kunna föras samman till meningsfulla satser. Vad som gäller tolkning av tal gäller förstås också produktion av tal, där hjärnan måste planera innehållet i vad som skall sägas, samtidigt som den väljer ut de ord genom vilka innehållet skall uttryckas, ordnar orden inbördes och ger de impulser till talapparatens muskler varigenom orden kan produceras. Det mesta av denna planering är rimligtvis gemensam för talat språk och för exempelvis de dövas teckenspråk. Skillnaden består främst i att de slutliga nervimpulserna i det senare fallet inte går till talapparaten, utan till händerna, och att analysen vid mottagningen vilar på synsinnet, inte på hörseln. Hjärnans allt överskuggande betydelse för språket framgår tydligt av att hjärnskador av olika slag kan starkt påverka språkförmågan, även om talapparaten som sådan är oskadd (se afasi). Den mänskliga hjärnans centrala betydelse för språkförmågan framgår också av de experiment som gjorts med att lära apor de dövas teckenspråk. Resultaten av dessa är kontroversiella, men aporna har i varje fall inte kommit förbi en mänsklig tvåårings nivå. Med sin välutvecklade kontroll av händerna lär sig aporna ganska lätt en stor mängd tecken, och de kan förbinda dessa med en fast betydelse. Däremot förmår de inte bilda satser av orden.

Språkförmågans beroende av hjärnans utveckling speglas också av barnets språkutveckling. Barnets första användning av talapparaten är av samma art som djurens. Det frambringar läten som kan tolkas som signaler för tillfredsställelse, lust eller olust. Men redan under de första månaderna kan man iaktta hur småbarn härmar vårdarens ansiktsuttryck, inklusive munnens rörelser. De inre, genetiskt bestämda utvecklingsmönstren hos talorganen och hjärnan samspelar hela tiden med den påverkan som den yttre omgivningen utövar. När jollret blir mer språkliknande finner man skillnader mellan barn från olika kulturer, beroende på vilket språk som omgivningen använder. Kinesiska småbarns joller under andra halvåret låter inte som svenska småbarns.

Människornas och människoapornas utvecklingslinjer torde ha skilts från varandra för 5–8 miljoner år sedan. Vårt språk har antagligen i huvudsak utvecklats under den senaste årmiljonen, under vilken den genomsnittliga mänskliga hjärnvolymen ökat kraftigt, från ca 800 cm3 till 1 400 cm3. Vissa anatomiska drag hos neandertalmänniskan antyder att denna möjligen hade mindre förmåga till ljuddifferentiering än nutida människor. Det är dock inte rimligt att anta att språket först uppstod med den fullt utvecklade människans framträdande. Eftersom språket är beroende av många små och samordnade genetiska förändringar i både talorganen och hjärnan har dess utveckling säkerligen tagit mycket lång tid. Detta antyds också av att ingen väsentlig förändring av språkets natur kan konstateras under den tid vi kan överblicka. Alla nu levande människor har språk som i stort sett har likartad struktur. Den australiska urbefolkningen, som antagligen varit skild från sina artfränder i flera tiotusental år, talar språk som inte i något väsentligt skiljer sig från övriga språk i världen.

Det finns mänskliga kulturer med en mycket enkel teknologi. Men det finns inga primitiva språk. Naturligtvis finns det språk som saknar uttryck för de flesta vetenskapliga begrepp och företeelser, men de har alla möjligheter att skapa dem, helt av egna resurser eller genom lån, precis som t.ex. svenskan har gjort under de senaste århundradena.

Det hävdas ibland att olikheter mellan språk ger olika världsbilder (Sapir–Whorf-hypotesen). Hypotesen håller dock inte i någon stark form, eftersom folk med mycket olika språk kan ha en mycket likartad kultur och världsbild, och omvänt. Det är heller inte rimligt att påstå att vårt tänkande är helt bundet till språket. För det första sker en hel del tänkande normalt utan någon som helst språklig inblandning, t.ex. det som ligger bakom pusselläggning eller bilkörning. För det andra är det visserligen sant att tankar inom vissa ämnesområden uttrycks bättre, lättare och elegantare på vissa språk än andra. Men i princip kan vad som kan uttryckas på ett språk också uttryckas på ett annat.

Å andra sidan är det uppenbart att språket är ett utomordentligt hjälpmedel för vårt tänkande. Genom att ge namn åt företeelser och begrepp ger vi mer beständighet åt dem i vårt tänkande och kan därför hantera dem lättare. Denna egenskap hos språket förstärktes kraftigt i och med uppfinnandet av skriften. Genom den kunde vårt sinne göras permanent, och tankekedjor av tidigare oanad längd kunde byggas upp. På så sätt är språket, framför allt genom sin vidareutveckling i skriften (och i datorerna), grunden för vetenskapen och därmed också för den explosionsartade utveckling av den mänskliga kulturen som vetenskapen har inneburit.

Alla språk utnyttjar ett mycket begränsat antal språkljud (fonem), vilka i stort sett är ljudmotsvarigheten till bokstäverna i ett språk med idealisk alfabetisk stavning. Antalet fonem i olika språk rör sig mellan ett par dussin och ungefär ett hundratal. Med hjälp av fonemen, som själva saknar betydelseinnehåll, byggs orden upp; t.ex. betyder ljuden eller bokstäverna t, a, m i sig själva ingenting, men med deras hjälp kan man bygga upp ett antal olika svenska ord: tam, mat, ta. Med svenskans ca 30 fonem kan vi bilda hundratusentals ord med olika betydelser, som i sin tur byggs upp till yttranden (satser, meningar) av i princip obegränsad längd. Detta brukar kallas språkets dubbla artikulation. Att uttrycka alla dessa betydelser med var sin ljudbild, utan den sorts systematisering som fonemen (och alfabetet) erbjuder, skulle ställa både vårt minne och vår urskillningsförmåga inför en omöjlig uppgift. Den dubbla artikulationen var helt enkelt nödvändig om språket skulle bli i stånd att spegla den mångskiftande verklighet som människan levde i och lever i. Våra släktingar aporna tycks kunna producera och urskilja några dussin olika läten med olika betydelse. För detta krävs inte någon dubbel artikulation, och de har den inte heller. Deras hjärna tycks inte ge dem den möjligheten. Den alfabetiska skriften är en sen uppfinning som i princip innebar att man ”upptäckte” den fonematiska principen, som är gemensam för alla mänskliga språk. Eftersom alla människor dessutom är fysiskt lika, lever i liknande miljöer och har liknande biologiska behov är många drag hos språken gemensamma. Inga språk saknar helt beteckningar för djur, växter och ting, för egenskaper hos dessa och för mänskliga aktiviteter som äta, sova och springa. Men sätten att uttrycka sådant kan vara mycket olika.

Användningen av släktskapstermer (den indoeuropeiska, den finsk-ugriska språkfamiljen, latinets dotterspråk franskan etc.) för att beskriva hur språk förhåller sig till varandra har bidragit till en vanlig sammanblandning av språk och ras. Ändå säger minsta eftertanke att ett gemensamt språk ingalunda betyder gemensam härstamning. Kinesiska barn som växer upp i Sverige lär sig tala svenska med samma dialekt som sina svenska lekkamrater. Den moderna franskan är till största delen en vidareutveckling av latinet, men Frankrikes nuvarande befolkning är biologiskt sett mycket mer kelters och germaners än romares ättlingar. Ett gemensamt språk eller dialekt har otvivelaktigt en gruppskapande (och gruppskiljande!) funktion. Men det är fel att blanda samman språklig gemenskap med biologisk. Även om det av naturliga skäl finns en positiv korrelation mellan språklig och genetisk släktskap är det viktigt att hålla fast vid att de två är fundamentalt olika.

Av det föregående framgår att svaret på frågan om vad som är ett ”språk” ofta måste bli ganska godtyckligt. Det betyder också att det är mycket vanskligt att ge statistik om antalet språk som talas i ett visst område. Många delar av världen är dessutom ännu dåligt kartlagda språkgeografiskt. Det är ändå ganska klart att de uppskattningar som ges även i relativt nya framställningar är tagna i underkant; antalet språk i världen måste antas vara åtminstone 5 000.

I vissa delar av världen är språksplittringen mycket stor. På Nya Guinea omnämns i litteraturen ett tusental olika språk, som talas av sammanlagt ca 2,5 miljoner människor. Siffror av det här slaget beror nog delvis på att forskare som kartlagt utomeuropeiska kulturer har varit ganska generösa när de har räknat språk – orsamålet och älvdalsmålet hade med stor sannolikhet räknats som olika språk om de hade talats på Nya Guinea – men återspeglar säkert också en rätt typisk situation i många förindustriella samhällen, där nästan varje by eller varje stam hade sitt språk. Den här språksplittringen tenderar att försvinna när de traditionella samhällena kommer i kontakt med ”den moderna civilisationen”, både genom språkbyte och genom att ursprungsbefolkningen minskar genom sjukdomar och utrotning. I dag är situationen den att närmare hälften av världens befolkning talar – eller åtminstone räknas som talare av – något av de tio mest spridda språken. Även här är statistiken besvärlig: två- och flerspråkighet är vanligare än man i allmänhet tror, och dessutom ligger det ofta i myndigheternas intresse att förminska betydelsen av olika minoritetsspråk. När det gäller att uppskatta vilka språk som har den största politiska och ekonomiska betydelsen är å andra sidan antalet talare av mindre intresse. Även om hindi/urdu har nästan lika många talare som engelska är det förras användning i stort sett begränsad till Indiska halvön, medan det senare är officiellt språk i ca 70 länder (inklusive icke-självständiga territorier) vilkas sammanlagda BNP är åtminstone 35 % av jordens totala, en siffra som kan vara en god indikator på engelskans dominerande ställning.

Den traditionella grundvalen för att klassificera språk är språksläktskap – man för ihop språk som kan antas ha utvecklats ur ett gemensamt urspråk till språkfamiljer. Vid fastställandet av språksläktskap har man stor hjälp av den under 1800-talet utvecklade historisk-komparativa eller jämförande språkforskningen, där tidigare språkstadier rekonstrueras genom systematiska jämförelser av besläktade språks grammatik och ordförråd. Detta har särskilt stor betydelse i områden där det är ont om skriftligt belagda äldre språkformer. De flesta språken i världen kan numera med någorlunda säkerhet hänföras till någon av omkring trettio språkfamiljer. Det är sannolikt att många av dessa är sinsemellan besläktade, men ju längre tillbaka man går desto svårare blir det att uttala sig om språkens släktskap.

Historiskt besläktade språk är naturligtvis oftast mer lika än obesläktade språk. Ändå kan en klassificering efter språksläktskap inte tjäna en typologisk klassificering av språk, dvs. en indelning av språk efter likhetsprincipen. De tidigaste försöken till en klassificering av denna typ grundar sig på observationen att språk skiljer sig kraftigt åt i fråga om ordens inre struktur, framför allt vad gäller förekomsten av böjnings- och avledningsprocesser. Senare har framför allt syntaktiska kriterier blivit vanliga inom språktypologin, samtidigt som man har avlägsnat sig från målet att entydigt indela språk i olika typer. Snarare intresserar man sig för att finna samband mellan olika egenskaper hos språk.

Under olika perioder i språkvetenskapens historia har språkforskare tenderat att betona antingen likheterna eller olikheterna mellan mänskliga språk. Fram till 1700-talet såg man ofta språket som en direkt spegelbild av den för alla människor gemensamma tankeförmågan, och man betraktade därför gärna de olikheter man fann mellan olika språk som ”tillfälliga”. När europeiska forskare så småningom kom i kontakt med utomeuropeiska språk blev de starkt medvetna om svårigheterna att tillämpa den traditionella, latinbaserade grammatikens begrepp på dem, vilket ledde till att man i stället betonade varje språks egenart. Mest uttalade var väl dessa tendenser i den amerikanska språkvetenskapen under första hälften av 1900-talet. Under andra hälften av 1900-talet började man se lagbundenheterna bakom mångfalden, och många forskare har kommit att betona språktillägnandets beroende av biologiska faktorer. De flesta är numera ense om att det finns starka begränsningar på hur olika språk kan vara.

Två av de viktigaste medlen för att signalera grammatisk struktur i språk är ordböjning och ordföljd. Dessa begrepp har också spelat en stor roll i den språktypologiska forskningen. En traditionell indelning av språk i olika typer bygger på förekomsten av böjnings- och avledningsprocesser (morfologiska processer), dvs. företeelser som prefix och suffix (ändelser) och stamförändringar (som avljudsförändringarna i svenska starka verb, t.ex. dricka, drack, druckit). I vissa språk saknas morfologiska processer helt eller nästan helt. Dessa brukar kallas isolerande, ett exempel är vietnamesiskan. De språk som har mer eller mindre utvecklad morfologi indelas i agglutinerande och flekterande på grundval av hur väl skilda de olika morfemen i ett ord är från varandra. I ett agglutinerande språk som turkiska består ett ord ofta av en oföränderlig stam plus en lång rad ändelser med klara inbördes gränser, t.ex. bleke ’vänta’ -me (negation) -yor (tempus) -um (’jag’ – subjekt), dvs. ’jag väntar inte’, medan i typiskt flekterande språk som latin och klassisk grekiska ordböjningen kompliceras av företeelser som stamväxlingar (som i svenska starka verb) och av att en enda ändelse samtidigt uttrycker flera böjningskategorier, som när ändelsen -i i latin vidi ’jag har sett’ kan sägas markera både (första) person, numerus (singularis) och tempus/aspekt (perfekt). Eftersom det är svårt att entydigt föra språk till den ena eller andra av dessa typer talar man numera hellre om att ett visst språk uppvisar en större eller mindre grad av fusion (sammansmältning av morfem) i sin morfologi.

Det som i ett språk med mindre väl utvecklad morfologi uttrycks analytiskt, dvs. som ett självständigt ord, kan i ett språk med rikare morfologi uttryckas syntetiskt, dvs. som ett affix eller någon annan form av morfologisk markering. (Termerna analytisk och syntetisk används också för att karakterisera hela språk.) Exempelvis motsvaras svenskans pronomen och prepositioner ofta av ändelser i andra språk. Språk med särskilt rik morfologi, där en hel sats ofta består av ett enda ord, kallas polysyntetiska eller inkorporerande. Typiska exempel är många av de språk som talas av ursprungsbefolkningen i Nordamerika. Här är en ”ordsats” från totonac, ett språk som talas i Mexico: a-k-ma-ʔaksta-ʔaqapi-tshaqa-ni-qu-kam-putu-ma-w; (översättning morfem för morfem: imperfekt-vi-få-sig-öra-tvätta-indirektiv-sluta-sig-önska-progressiv-vi), dvs.’vi vill få honom att sluta tvätta öronen’.

En klassificering av detta slag kompliceras av att det ofta är svårt att bestämma vad som är ett självständigt ord. I svenskt talspråk förekommer hopdragningar som nästan liknar de exempel som just anförts: det som skrivs ”fattar du inte det” kan uttalas – i vad som verkar vara ett ord – ”fattaruntede”. Historiskt kan ett isolerande språk på liknande sätt ganska snabbt utvecklas till att bli ett böjningsspråk.

En betydande del av den moderna språktypologiska forskningen har rört sig omkring de medel som används i olika språk för att markera satsens huvuddelar, t.ex. subjekt, predikatsverb och objekt. Det som i svenskan i första hand avgör vilket substantiv som tilldelas vilken roll är ordföljden. I satsen Flickan såg pojken är flickan subjekt, pojken objekt; i Pojken såg flickan är rollerna ombytta. Det finns dock ord i svenskan som har olika former beroende på om de fungerar som subjekt eller objekt, nämligen pronomen som han/honom och hon/henne. I sådana fall kommer ordföljden att få en underordnad betydelse: Han (subjekt) såg henne (objekt). Henne (objekt) såg han (subjekt). I många språk har inte bara pronomen utan även substantiv olika böjningsformer i subjekts- och objektsfunktion.

En allmän iakttagelse är att språk med väl utvecklad kasusböjning, t.ex. latin och ryska, tenderar att ha friare ordföljd än språk med ingen eller nästan ingen kasusböjning, som svenska eller engelska. När man talar om ”friare ordföljd” betyder det inte att ordföljden är godtycklig, utan att den används mer till att signalera vad man kan kalla satsens informationsstruktur, dvs. vad som är det kända man utgår ifrån och vad som är den nya informationen i satsen; se informationsdynamik. Det är dessutom ofta möjligt att hitta en ordföljd som är vanligare eller uppfattas som mer neutral än andra. Denna ordföljd, som kan kallas språkets grundordföljd, har varit utgångspunkt för en rad typologiska studier.

Om man håller sig till satser med strukturen subjekt (S)–(predikats)verb (V)–objekt (O) är det logiskt möjligt att ordna de ingående delarna på sex olika sätt, som vi kan beteckna SVO, SOV, VSO, VOS, OSV och OVS. Det visar sig att den överväldigande majoriteten av de språk i vilka man kan fastställa en grundordföljd väljer en av de tre första möjligheterna, dvs. en där subjektet kommer före objektet. De tre senare återfinns inte i mer än sammanlagt ca 1 % av de språk som talas på jorden; ett av de bättre kända exemplen är malagasy. Denna situation är relativt typisk. I språktypologin är det ofta möjligt att konstatera mycket starka tendenser, som dock sällan är undantagslösa.

Bland de språk som har subjektet före objektet är det ungefär hälften som har verbet sist i satsen, dvs. SOV-ordföljd. Några mer kända sådana språk är japanska och turkiska. Bland de övriga är SVO klart vanligare än VSO. SVO förekommer t.ex. i de flesta större språken i Europa. VSO kan man hitta bl.a. i arabiska och i keltiska språk.

I ett arbete som har blivit klassiskt inom den moderna språkvetenskapen visade Joseph Greenberg att det finns ett mycket klart samband mellan grundordföljden (ordningen mellan huvudsatsdelarna) och ordningen i en rad andra syntaktiska konstruktioner i olika språk. Det kanske viktigaste fallet rör sambandet mellan verbets placering i förhållande till objektet och förekomsten av prepositioner respektive postpositioner (gemensamt kallade adpositioner). Det visar sig att VSO- och SVO-språk huvudsakligen använder prepositioner (som alltså står framför det uttryck de bestämmer) medan SOV-språk i allmänhet föredrar postpositioner (som står efter det uttryck de bestämmer). Åtminstone delvis reflekterar dessa samband en mer allmän tendens i språk att konsekvent placera ”huvudet” i syntaktiska konstruktioner antingen först eller sist. Det finns dock många undantag till de här generaliseringarna. Man kan t.ex. notera att svenska, som är ett SVO-språk, ändå har ordföljden adjektiv–substantiv.

Även de system som används för att kasusmarkera huvudsatsdelarna är av intresse ur språktypologisk synvinkel. Det kanske bäst studerade problemet rör förhållandet mellan kasusmarkeringen i intransitiva satser (som inte har objekt) och transitiva satser (som har objekt). (Med ”objekt” avses här och i fortsättningen det som traditionellt kallas ”ackusativobjekt” eller ”direkt objekt”.) I de flesta europeiska språk använder man samma princip som i latin och som illustreras av följande exempel: puer (NOMINATIV) currit ’pojken springer’; puer (NOMINATIV) vidit puellam (ACKUSATIV) ’pojken såg flickan’. Med andra ord har man ett kasus (nominativ) för subjektet, både i intransitiva och i transitiva satser, och ett annat för objektet. Många språk har emellertid ett annat system, som illustreras av följande exempel från avariska, ett kaukasiskt språk: wac-as (’bror’+ERGATIV) shisha (’flaska’+ABSOLUTIV) bekana ’krossade’, dvs. ’brodern krossade flaskan’; shisha (’flaska’+ABSOLUTIV) bekana ’gick sönder’, dvs. ’flaskan gick sönder’. I detta system har subjektet i den intransitiva satsen och objektet i den transitiva samma kasus (vanligtvis kallat absolutiv) medan det finns ett speciellt kasus för transitiva subjekt, ergativ. Man kallar ofta kasussystem av den första typen för ackusativa och system av den andra för ergativa. Ergativa kasussystem är något mindre vanliga än ackusativa, men förekommer ändå i språk från en lång rad språkfamiljer, t.ex. kaukasiska språk och australiska språk. Man kan också nämna baskiska som exempel. Det är relativt vanligt att båda typerna av system förekommer i samma språk. I kurdiska (ett indoiranskt språk) har man t.ex. ackusativ kasusmarkering vid vissa verbformer och ergativ markering vid andra.

På senare tid har man dragit paralleller mellan de olika typerna av kasusmarkering och skillnader som man hittar på andra håll i grammatiken. Sålunda kan system för verbkongruens vara uppbyggda enligt ackusativ eller ergativ princip. I de flesta europeiska språk kongruerar verbet bara med subjektet, men på många håll förekommer även kongruens med objektet. Ergativ verbkongruens skulle då innebära att verbet kongruerar med subjektet i intransitiva och objektet i transitiva satser. Som resultat av det sagda kan man ordna språk på en skala från konsekvent ackusativa till konsekvent ergativa, med kanske de flesta liggande någonstans mittemellan.

Ett annat område där det finns avsevärda skillnader mellan språk är ordklassystemet. När det gäller de tre stora lexikala ordklasserna substantiv, verb och adjektiv brukar distinktionen mellan substantiv och verb anses vara universell eller nästan universell. Däremot är adjektivens status mycket mer varierande. Ord som i svenskan hör till adjektiven kan i andra språk motsvara substantiv eller verb. Ordklassen adjektiv kan saknas helt eller bestå av endast ett fåtal medlemmar.

I vardagslivet använder vi orden ”språk” och ”dialekt” utan att finna dem särskilt problematiska. Vi anser t.ex. att engelska och svenska är olika språk och att skånska och dalmål är dialekter av svenska. Men det har visat sig mycket svårt att avgöra när två olika språkformer skall räknas som två språk och när de skall räknas som dialekter eller varianter av olika språk. Ett kriterium som ibland föreslås är ”ömsesidig förståelighet”. Om två språkformer utan vidare kan förstås sinsemellan skulle de enligt denna princip vara dialekter av samma språk. Det leder emellertid till att t.ex. svenska och norska borde vara dialekter av samma språk, vilket ju strider mot vad man vanligtvis brukar anta. Omvänt finns det många dialekter av svenska som knappast är förståeliga för riksspråkstalare, t.ex. dialekterna i övre Dalarna.

I själva verket har de kriterier man i praktiken använder när man skiljer mellan språk och dialekter inte så mycket med språken själva att göra som med deras roll i de samhällen där de används. En inte helt allvarlig definition som ofta citeras (och som faktiskt ger önskat resultat för de problematiska exempel som just nämnts) säger att ”ett språk är en dialekt med en armé och en flotta”. Den allvarliga kärnan i denna formulering är den att de språkformer som vi normalt kallar ”språk” är de som är officiella i någon mer eller mindre självständig politisk enhet. Detta sammanfaller i stor utsträckning med de språkformer som har en skriven form och används i undervisningen, näringslivet och politiken.

De europeiska folkens kolonisering av övriga världsdelar har lett till att ursprungsbefolkningarnas språk på många ställen bara finns kvar i mindre, isolerade områden. När man beskriver språkfamiljernas utbredning i världen får man därför en klarare bild om man utgår från den situation som rådde före den europeiska kolonisationen, vilket görs i det följande.

Eurasien. Ur språkgeografisk synvinkel är det praktiskt att betrakta Europa och den asiatiska kontinenten som en enhet, eftersom alla de större språkfamiljerna i Europa finns också i Asien.

Den språkfamilj som svenskan hör till, den indoeuropeiska, kan sägas inta en särställning bland världens språkfamiljer. Den är dominerande i större delen av Europa och i ett större sammanhängande område i Asien (Iran, Afghanistan, delar av f.d. Sovjetunionen och norra delen av Indiska halvön). Bland världens tio mest talade språk är sju indoeuropeiska. Det är också den språkfamilj vars historia är bäst klarlagd. De nu levande indoeuropeiska språken indelas i ett antal undergrupper. Baskiskan, som talas i norra Spanien och sydvästra Frankrike, anses som ett isolerat språk utan kända släktingar.

Två stora språkfamiljer som är representerade i Europa men även i Asien är den uraliska och den altaiska, av en del forskare sammanförda till en familj, kallad den ural-altaiska. Den dominerande språkfamiljen i Främre Orienten är den afroasiatiska; se Afrika nedan. Ett område på gränsen mellan Europa och Asien med stor språksplittring är Kaukasus, där ett fyrtiotal språk brukar föras samman under benämningen kaukasiska språk. Den större delen av den indiska subkontinenten domineras av de dravidiska språken. En mindre språkgrupp i Indien med något oklar klassificering är munda.

Den språkfamilj i världen som efter de indoeuropeiska har flest talare är den sinotibetanska. Ytterligare språkfamiljer i Sydöstasien är den austroasiatiska och kadaispråken, till vilka bl.a. taispråken hör.

I Oceanien finns huvudsakligen två väletablerade språkfamiljer företrädda: de australiska språken, som talas av urbefolkningen på den australiska kontinenten och på Nya Guinea, och de austronesiska eller malajo-polynesiska, vilkas utbredning täcker större delen av Stilla havet men även är företrädda i Sydöstasien (med t.ex. malajiska) och på Madagaskar (malagasy).

Nord- och Sydamerika. Vi vet mycket litet om de äldre stadierna av de språk som talas och talades av urbefolkningen på de två amerikanska kontinenterna, och man blir tvungen att anta ett relativt stort antal språkfamiljer, om vilkas eventuella släktskapsrelationer man inte kan uttalas sig med bestämdhet. Några av de mer betydande språkfamiljerna i Nordamerika är den eskimåisk-aleutiska längst i norr, na-dene i väster, algonkinspråk huvudsakligen i öster och ”Macro-Siouan”, en sammanfattande benämning på bl.a. siouxspråk, irokesiska och några andra mindre grupper. Dessutom finns i Nordamerika de azteko-tanoanska språken. I Sydamerika, som är den ur språkgeografisk synvinkel sämst kartlagda kontinenten, kan man nämna den andinsk-ekvatoriala språkfamiljen samt den ge-pano-karibiska, omfattande ett stort antal språk i bl.a. Venezuela, Colombia och Brasilien.

Afrika. De språk som talades i det förkoloniala Afrika kan hänföras till fyra språkfamiljer. Dominerande i de nordliga delarna av Afrika och även i Främre Asien är de afroasiatiska språken, där de semitiska språken är den mest kända undergruppen. I Afrika söder om Sahara hör de flesta språken (omkring 900 stycken) till Niger-Kongospråken (Niger-Kordofanspråken), där den mest framträdande undergruppen är bantuspråken. Två mindre språkfamiljer är de nilo-sahariska språken och khoisanspråken. De senare talas i södra Afrika.