TEORI BAHASA DAN OTOMATA

Rabu, 25 April 2012

Teori Bahasa

  • Teori bahasa membicarakan bahasa formal (formal language), terutama untuk kepentingan perancangan kompilator (compiler) dan pemroses naskah (text processor).
  • Bahasa formal adalah kumpulan kalimat. Semua kalimat dalam sebuah bahasa dibangkitkan oleh sebuah tata bahasa (grammar) yang sama.
  • Sebuah bahasa formal bisa dibangkitkan oleh dua atau lebih tata bahasa berbeda.
  • Dikatakan bahasa formal karena grammar diciptakan mendahului pembangkitan setiap kalimatnya. 
  • Bahasa Natural/manusia bersifat sebaliknya; grammar diciptakan untuk meresmikan kata-kata yang hidup di masyarakat. Dalam pembicaraan selanjutnya ‘bahasa formal’ akan disebut ‘bahasa’ saja
  • Otomata adalah mesin abstrak yang dapat mengenali (recognize), menerima (accept), atau membangkitkan (generate) sebuah kalimat dalam bahasa tertentu.

Beberapa Pengertian Dasar :


·   Simbol adalah sebuah entitas abstrak (seperti halnya pengertian titik dalam geometri). Sebuah hurufatau sebuah angka adalah contoh simbol.
·      String adalah deretan terbatas (finite) simbol-simbol. Sebagai contoh, jika a, b, dan c adalah tiga buah simbol maka abcb adalah sebuah string yang dibangun dari ketiga simbol tersebut.
·       Jika w adalah sebuah string maka panjang string dinyatakan sebagai ïwï dan didefinisikan sebagai cacahan (banyaknya) simbol yang menyusun string tersebut. Sebagai contoh, jika w = abcb maka ïwï= 4.
·    String hampa adalah sebuah string dengan nol buah simbol. String hampa dinyatakan dengan simbol e (atau ^) sehingga ïeï= 0. String hampa dapat dipandang sebagai simbol hampa karena keduanya tersusun dari nol buah simbol.
·         Alfabet adalah hinpunan hingga (finite set) simbol-simbol

Operasi Dasar String

Diberikan dua string : x = abc, dan y = 123
·   Prefik string w adalah string yang dihasilkan dari string w dengan menghilangkan nol atau lebihsimbol-simbol paling belakang dari string w tersebut.
Contoh : abc, ab, a, dan e adalah semua Prefix(x)
·       ProperPrefix string w adalah string yang dihasilkan dari string w dengan menghilangkan satu atau lebih simbol-simbol paling belakang dari string w tersebut.
Contoh : ab, a, dan e adalah semua ProperPrefix(x)
·      Postfix (atau Sufix) string w adalah string yang dihasilkan dari string w dengan menghilangkan nol atau lebih simbol-simbol paling depan dari string w tersebut.
Contoh : abc, bc, c, dan e adalah semua Postfix(x)
·    ProperPostfix (atau PoperSufix) string w adalah string yang dihasilkan dari string w dengan menghilangkan satu atau lebih simbol-simbol paling depan dari string w tersebut.
Contoh : bc, c, dan e adalah semua ProperPostfix(x)
·         Head string w adalah simbol paling depan dari string w.
Contoh : a adalah Head(x)

·    Tail string w adalah string yang dihasilkan dari string w dengan menghilangkan simbol paling depan dari string w tersebut.
Contoh : bc adalah Tail(x)
·     Substring string w adalah string yang dihasilkan dari string w dengan menghilangkan nol atau lebih simbol-simbol paling depan dan/atau simbol-simbol paling belakang dari string w tersebut.
Contoh : abc, ab, bc, a, b, c, dan e adalah semua Substring(x)
·  ProperSubstring string w adalah string yang dihasilkan dari string w dengan menghilangkan satu atau lebih simbol-simbol paling depan dan/atau simbol-simbol paling belakang dari string w tersebut.
Contoh : ab, bc, a, b, c, dan e adalah semua Substring(x)
·   Subsequence string w adalah string yang dihasilkan dari string w dengan menghilangkan nol atau lebih simbol-simbol dari string w tersebut.
Contoh : abc, ab, bc, ac, a, b, c, dan e adalah semua Subsequence(x)
·    ProperSubsequence string w adalah string yang dihasilkan dari string w dengan menghilangkan satu atau lebih simbol-simbol dari string w tersebut.
Contoh : ab, bc, ac, a, b, c, dan e adalah semua Subsequence(x)
·  Concatenation adalah penyambungan dua buah string. Operator concatenation adalah concate atautanpa lambang apapun.
Contoh : concate(xy) = xy = abc123
·     Alternation adalah pilihan satu di antara dua buah string. Operator alternation adalah alternate atau ½.
Contoh : alternate(xy) = x½y = abc atau 123
·         Kleene Closure : x* = e½x½xx½xxx½… = e½x½x½x½
·         Positive Closure : x = x½xx½xxx½… = x½x½x½


Beberapa Sifat Operasi

·         Tidak selalu berlaku : x = Prefix(x)Postfix(x)
·         Selalu berlaku : x = Head(x)Tail(x)
·         Tidak selalu berlaku : Prefix(x) = Postfix(x) atau Prefix(x) ¹ Postfix(x)
·         Selalu berlaku : ProperPrefix(x) ¹ ProperPostfix(x)
·         Selalu berlaku : Head(x) ¹ Tail(x)
·    Setiap Prefix(x), ProperPrefix(x), Postfix(x), ProperPostfix(x), Head(x), dan Tail(x) adalah Substring(x), tetapi tidak sebaliknya
·         Setiap Substring(x) adalah Subsequence(x), tetapi tidak sebaliknya
·         Dua sifat aljabar concatenation :
¨      Operasi concatenation bersifat asosiatif : x(yz) = (xy)z
¨      Elemen identitas operasi concatenation adalah e : ex = xe = x
·         Tiga sifat aljabar alternation :
¨      Operasi alternation bersifat komutatif : x½y = y½x
¨      Operasi alternation bersifat asosiatif : x½(y½z) = (x½y)½z
¨      Elemen identitas operasi alternation adalah dirinya sendiri : x½x = x
·         Sifat distributif concatenation terhadap alternation : x (y½z) = xy½xz
·         Beberapa kesamaan :
¨      Kesamaan ke-1 : (x*)* = x*
¨      Kesamaan ke-2 : e½x = x½e = x*
¨      Kesamaan ke-3 : (x½y)* = e½x½y½xx½yy½xy½yx½… = semua string yang merupakan concatenation dari nol atau lebih x, y, atau keduanya.

 

GRAMMAR DAN BAHASA

Konsep Dasar


·       Anggota alfabet dinamakan simbol terminal.

·       Kalimat adalah deretan hingga simbol-simbol terminal.

·       Bahasa adalah himpunan kalimat-kalimat. Anggota bahasa bisa tak hingga kalimat.

·       Simbol-simbol berikut adalah simbol terminal :
ü huruf kecil, misalnya : a, b, c, 0, 1, ..
ü simbol operator, misalnya : +, -, dan ´
ü simbol tanda baca, misalnya : (,  ),  dan ;
ü string yang tercetak tebal, misalnya : if, then, dan else.

·       Simbol-simbol berikut adalah simbol non terminal /Variabel :
ü huruf besar, misalnya : A, B, C
ü huruf S sebagai simbol awal
ü string yang tercetak miring, misalnya : expr

·  Huruf yunani melambangkan string yang tersusun atas simbol-simbol terminal atau simbol-simbol non terminal atau campuran keduanya, misalnya : a, b, dan g.

·   Sebuah produksi dilambangkan sebagai a ® b, artinya : dalam sebuah derivasi dapat dilakukan penggantian simbol a dengan simbol b.

·     Derivasi adalah proses pembentukan sebuah kalimat atau sentensial. Sebuah derivasi dilambangkan sebagai : a Þ b.

·       Sentensial adalah string yang tersusun atas simbol-simbol terminal atau simbol-simbol non terminal atau campuran keduanya.

·    Kalimat adalah string yang tersusun atas simbol-simbol terminal. Kalimat adalah merupakan sentensial, sebaliknya belum tentu..

Grammar :


Grammar G didefinisikan sebagai pasangan 4 tuple : V, V, S, dan P, dan dituliskan sebagai G(V, V, S, P), dimana :

V      : himpunan  simbol-simbol  terminal  (alfabet) àkamus
V      : himpunan simbol-simbol non terminal
SÎV : simbol awal (atau simbol start)
P          : himpunan produksi

Contoh :

1.  G1 :  VT = {I,  Love, Miss, You}, V = {S,A,B,C},
                   P = {S ® ABC, A® I, B® Love | Miss, C® You}

S Þ ABC
   Þ IloveYou

L(G1)={IloveYou, IMissYou}

2. . G2 :  VT = {a}, V = {S}, P = {S ® aS½a} 

S Þ aS
   Þ aaS
   Þ aaa                    L(G2) ={an ½ n ≥ 1}

             L(G2)={a, aa, aaa, aaaa,…}



 

0 komentar:

Posting Komentar