|
Article on other languages:
|
Tietojenkäsittelytieteessä taulukko (engl. array) on alkeellinen tietorakenne, jota käytetään lähes kaikissa muutamaa riviä pidemmissä tietokoneohjelmissa. Sitä voi verrata numeroituun lokerikkoon, jonka jokaisessa lokerossa on yksi arvo. Taulukko koostuu peräkkäisistä tallennuspaikoista, ”alimuuttujista”. Niiden arvoja kutsutaan taulukon alkioiksi. Alkioiden tallennuspaikat on numeroitu yleensä nollasta alkaen, ja tätä järjestysnumeroa kutsutaan indeksiksi. Taulukon pituus eli alkioiden lukumäärä valitaan, kun taulukko luodaan. Pituus on kiinteä, tai sen muuttaminen on hidasta. Alkioiden täytyy olla samaa tyyppiä. Esimerkiksi kuuden alkion pituinen taulukko, jossa on kirjainmerkit ’q’, ’w’, ’e’, ’r’, ’t’ ja ’y’, näyttää seuraavalta:
Taulukon matemaattinen malli on äärellinen lukujono, ja sen avulla voidaan toteuttaa vektori ja matriisi.
SuorituskykyTaulukon yleisimpien operaatioiden asymptoottinen suoritusaika:
Lisäys on O(n), koska taulukon kokoa ei voi kasvattaa muuten kuin kopioimalla kaikki alkiot uuteen taulukkoon. Välimuisti kykenee nopeuttamaan taulukko-operaatioita huomattavasti, jolloin teoriassa taulukkoa nopeampi tietorakenne saattaa olla käytännössä hitaampi. Taulukkoon voidaan tallentaa tietoa hyvin tiiviisti, koska ylimääräisiä osoittimia ei tarvita toisin kuin linkitetyissä tietorakenteissa. Kun taulukossa n alkiota ja yksi alkio vie tilaa k tavua, taulukko vaatii n · k tavua muistia. Lisäksi yleensä täytyy säilyttää myös taulukon koko ja viite taulukkoon. Ohjelmointi taulukollaOlkoon taulukko T alustettu seuraavaksi:
Kun T on alustettu, sen alkioita voidaan käyttää laskutoimituksissa. Alkioihin viitataan indeksoimalla, mikä useimmissa kielissä näyttää seuraavalta: T[3] - 1 Yllä olevan laskutoimituksen tulos on 1983 – 1 = 1982. Kuten muuttujaan, myös taulukkoon voidaan sijoittaa uusi arvo vanhan tilalle. Indeksissä 1 olevan luvun (1965) muuttaminen luvuksi 2001 onnistuu yleensä seuraavaan tapaan: T[1] := 2001 Yllä oleva luetaan: ”Taulukon T alkio indeksissä 1 saa arvokseen 2001.” Tämän operaation jälkeen taulukko T on muuttunut:
LäpikäyntiUsein taulukon jokaiselle alkiolle halutaan tehdä jotakin. Jos taulukon koko on 6, täytyy käydä läpi indeksit 0..5. Tähän käytetään ohjelmointikielen for-lausetta seuraavaan tapaan:
(i käy läpi arvot 0..5, ja joka arvolla
toistetaan sisennettyä lausetta)
for i := 0 to 5 do
tee jotain T[i]:n kanssa
end for
Yleisesti:
T: taulukko
n: taulukon koko
f: funktio, joka tekee jotain alkiolle
for i := 0 to n-1 do
f(T[i])
end for
Monissa ohjelmointikielissä on myös for each -lause, joka helpottaa taulukon ja muiden säiliöiden läpikäyntiä. Tämä on kuitenkin rajoittuneempaa kuin indeksoiminen: jokainen alkio täytyy käydä läpi, alkion indeksiä ei ole saatavilla ja joissakin ohjelmointikielissä taulukkoon ei voi sijoittaa tällä tavalla.
for each a in T do
f(a)
end for
Funktionaalista ohjelmointia tukevissa kielissä for each voi olla toteutettu korkeamman kertaluvun funktiona eli funktiona, joka saa parametrikseen funktion. for_each(f, T) Alkion etsiminenYksinkertainen hakualgoritmi on peräkkäishaku, jossa taulukosta etsitään arvo käymällä alkiot yksi kerrallaan läpi. Pseudokoodina:
function peräkkäishaku(T, k, n)
T: taulukko
k: haettava arvo
n: taulukon koko
jos arvo löytyy, palauttaa etsityn arvon indeksin (ensimmäisen vastaan tulevan)
jos arvoa ei löydy, palauttaa -1
for i := 0 to n-1 do
if T[i] = k then return i
end for
(ei löytynyt)
return -1
end function
Jos taulukko on järjestetty, voidaan käyttää tehokkaampaa puolitushakua. Koon kasvattaminenTaulukon kokoa ei varsinaisesti voi kasvattaa, mutta vanhan taulukon alkiot voi kopioida uuteen, suurempaan taulukkoon. Yleisimmissä ohjelmointikielissä on välineitä, jotka tekevät tämän automaattisesti, esimerkiksi C++:n std::vector ja Javan Vector tai ArrayList.
T: vanha taulukko
S: uusi taulukko
n: vanhan taulukon koko
S := new table(n * 2)
for i := 0 to n - 1 do
S[i] := T[i]
end for
C-kielessä voidaan yrittää kasvattaa taulukon kokoa, mikä onnistuu vain, jos keskusmuistissa on riittävästi vapaata muistia taulukon perässä. Jos alkioita joudutaan jatkuvasti lisäämään ja poistamaan, linkitetty lista voi olla parempi tietorakenne. Alkion poistaminenAlkion poistamiseen on useita ratkaisuja. Yksi on kopioida kaikki alkiot poistettavaa lukuun ottamatta uuteen taulukkoon. Yleinen tapa on myös poistettavan alkion jälkeen tulevien alkioiden vetäminen yksi indeksi eteenpäin:
T: taulukko
n: taulukon koko
d: poistettavan alkion indeksi
for i := d to n – 2 do
T[i] := T[i + 1]
end for
Tämän jälkeen voidaan:
Taulukon pienentäminen jokaisen poiston yhteydessä on nopeusrasite, joten yleensä kannattaa huijata: mikäli taulukon koko vaikkapa puolittuu, kannattaa harkita sen pienentämistä oikeasti. Alkion lisääminen taulukon alkioiden väliinUuden alkion lisääminen taulukon alkioiden väliin (esimerkiksi suuruusjärjestyksen säilyttämistä varten) muistuttaa yllä esitettyä poistoalgoritmia: Alkioita täytyy työntää eteenpäin taulukon loppupäästä alkaen lisäyskohtaan asti. Jos työntämisen aloittaa lisäyskohdasta ja etenee loppua kohden, syntyy virhe: lisäyskohdan alkio kopioituu jokaiseen sitä seuraavaan taulukon paikkaan!
T: taulukko
a: indeksi, johon lisättävä alkio sijoitetaan
kasvata T:n kokoa yhdellä
n := T:n uusi koko
for i := n – 2 down to a do
T[i + 1] := T[i]
end for
Lisäyslajittelu käyttää hyväkseen yllä esitettyä lisäysalgoritmia. Lajitteleminen suuruusjärjestykseenTaulukon lajittelemiseksi suuruusjärjestykseen on kehitetty lukuisia lajittelualgoritmeja, joiden tehokkuus vaihtelee huomattavasti. Tehoton mutta yksinkertainen keino on valintalajittelu:
for i := 0 to n – 2 do
min := pienin alkio väliltä T[i]...T[n – 1]
vaihda T[i] <–> min
end for
MuunnelmiaOhjelmoinnissa taulukoita on kaikkialla, joten niistä on tehty lukuisia muunnelmia. Moniulotteiset taulukotTaulukot voivat olla moniulotteisia. Kaksiulotteisuus voidaan toteuttaa taulukolla, jonka alkiot ovat taulukoita:
T := new Table(korkeus)
for i := 0 to korkeus – 1 do
T[i] := new Table(leveys)
end for
Tämä toteutustapa luonnollisesti mahdollistaa kuinka moniulotteiset taulukot tahansa. Läpikäyntiin voidaan käyttää sisäkkäisiä for-lauseita:
for y := 0 to korkeus – 1
for x := 0 to leveys – 1
T[y][x] := 0
end for
end for
Sisäkkäiset taulukot mahdollistavat myös vaikkapa kolmionmuotoisen taulukon, josta voi olla hyötyä esimerkiksi toteutettaessa suuria symmetrisiä matriiseja. Linkitetty lista on yksinkertainen tietorakenne, joka ketjuttaa arvoja toisiinsa hitusen sisäkkäisten taulukoiden tapaan. Kaksiulotteista taulukkoa voidaan jäljitellä käyttämällä yksiulotteista taulukkoa: T := new Table(leveys * korkeus) seuraava vastaa ilmausta T[x][y] := 999 T[y * leveys + x] := 999 Tästä on se etu, että taulukko sijaitsee keskusmuistissa yhtenäisenä nauhana, jolloin välimuistitus saattaa parantua ja taulukon jokaiselle alkiolle on helpompi ja hitusen nopeampi tehdä operaatioita. Usein esimerkiksi bittikarttakuvat ladataan tähän muotoon keskusmuistiin. IndeksiväliNollalla alkavat indeksit ovat käytössä kaikissa yleisimmissä ohjelmointikielissä. Edsger Dijkstra puolusti nollalla alkavia indeksejä kirjoitelmassa Why numbering should start at zero. Kuitenkin joissakin ohjelmointikielissä ensimmäiseksi indeksiksi on valittu luku 1 eikä 0. Tässä lähestymistavassa on puolensa:
Toisaalta 0 on luonnollisempi ensimmäinen indeksi:
Joissakin ohjelmointikielissä voidaan valita taulukon indeksiväli itse (eli ne tukevat n-pohjaisia taulukoita); tällaisia ovat esimerkiksi Visual Basic, Pascal, Ada ja Lua. Ei ole selvää, onko tästä enemmän hyötyä vai haittaa: Ohjelmoijan täytyy tarkistaa taulukon indeksiväli erikseen, ja taulukkomuuttujan vastaanottaminen aliohjelman parametrina aiheuttaa omat hankaluutensa. Indeksialueen määriteltävyys auttaa eniten silloin, kun ohjelmoidaan tarkasti matemaattisten määritelmien mukaan. Taulukko laitteistoläheisestiTaulukko on helpoimpia tietorakenteita toteuttaa konekielen tasolla. Itse asiassa keskusmuistia voi ajatella nauhamaisena taulukkona, jota indeksoidaan muistiosoitteilla. Taulukko on vain yhtenäinen pätkä keskusmuistia. Taulukon luominenTaulukko luodaan pyytämällä käyttöjärjestelmää varaamaan vapaalta muistialueelta n · k tavua muistia, missä n on taulukon pituus ja k yhden alkion vaatima tila tavuina (32-bittisillä suorittimilla yleensä 4 tavua). Käyttöjärjestelmä vastaa antamalla osoittimen varatun muistialueen alkuun. Jos taulukon säilyy muistissa koko suorituksen ajan, tarvittava muistialue voidaan sisällyttää ohjelman binääriin. Paikallisena muuttujana käytettävä pieni taulukko voidaan myös luoda ajonaikaiseen pinoon. Taulukon indeksoiminenKäyttöjärjestelmän antama osoitin on arvo, joka sisältää taulukon ensimmäisen alkion muistiosoitteen – eli indeksin taulukkoon nimeltä keskusmuisti. Olkoon tuo osoite p. Jos halutaan käyttää taulukon ensimmäistä alkiota johonkin, prosessoria voidaan yksinkertaisesti käskeä noutamaan k tavua pitkä arvo muistiosoitteesta p. Jos halutaan noutaa arvo taulukon indeksistä 3, prosessoria käsketään noutamaan k tavua pitkä arvo osoitteesta p + 3 · k. Tällaista osoitteiden summausta kutsutaan osoitinaritmetiikaksi. Ohjelmointi ilman taulukoitaUseimmat ohjelmoijat ovat tottuneet käyttämään taulukoita jokapäiväsesti. Kuitenkin monissa funktio-ohjelmointikielissä, kuten LISPissä ja Haskellissa, alkeellisimpana tietorakenteena taulukon tilalla on linkitetty lista. Se sopii kieliin, joissa for-lauseen korvaa rekursio. Jos puhtaassa funktio-ohjelmointikielessä on taulukko, sen muuttaminen voi olla toteutettu käyttäen alkuperäisen taulukon päälle lisättyä hakurakennetta, jolloin indeksointi ei toimikaan vakioajassa. Lua perustuu assosiaatiotauluun, joka toimii myös taulukkona. Katso myösMuita primitiivisiä tietorakenteitaVaihtoehtoja
Taulukko-algoritmejaAiheesta muuallaTaulukosta yleisesti
Taulukko ohjelmointikielissä
|
This article is from Wikipedia. All text is available under the terms of the GNU Free Documentation License.