Lesson 41

Identifying Syllable Boundaries


One of the greatest challenges is reading Thai is identifying word boundaries - particularly if you're reading a text with unfamiliar words. However, there are a few strategies that can help to identify syllable boundaries. When faced with an unfamiliar text here are a few things you can try:

1. Scan for common grammatical words

This will break each phrase into shorter, more manageable pieces. These words include:


As you spend more time reading Thai your list of such words will expand.

Note that most of these words have an above vowel or tone mark. Generally, it's best to start looking above the characters before diving into more detail.

2. Identify syllable boundaries

The following characters mark the start of a syllable: เ◌, แ◌, โ◌, ใ◌, ไ◌

And the following ones mark the end of a syllable: , ◌ะ

3. Look for syllables clustered around ◌ั

Because ◌ั◌ is always preceded and followed by a consonant it's a handy way further to break down sentences. Remember to look for possible consonant clusters before ◌ั◌.

4. Look for syllables clustered around the other vowels

All vowels are associated with at least one consonant. The may be associated with a consonant cluster before, and (optionally) a consonant after.

5. Look at any fragments that haven't been accounted for

Such fragments must be associated with a preceding or following syllable. Adjust boundaries to address this.

6. Identify words from the syllables

Let's apply that technique to a short text (namely the first item of the Universal Declaration of Human Rights). Here's the original text:

มนุษย์ทั้งหลายเกิดมามีอิสระและเสมอภาคกันในเกียรติศักดและสิทธิ ต่างมีเหตุผลและมโนธรรม และควรปฏิบัติต่อกันด้วยเจตนารมณ์แห่งภราดรภาพ


Step 1: Scan for common grammatical words (shown in dark blue) we get:

มนุษย์ทั้งหลายเกิดมามีอิสระ และ เสมอภาคกันในเกียรติศักด และ สิทธิ ต่างมีเหตุผล และ มโนธรรม และ ควรปฏิบัติต่อกันด้วยเจตนารมณ์แห่งภราดรภาพ

Step 2: Identify syllable boundaries using เ◌, แ◌, โ◌, ใ◌, ไ◌ , ◌ะ

มนุษย์ทั้งหลาย กิดมามีอิสรสมอภาคกัน น กียรติศักด  สิทธิ ต่างมี หตุผล  ม นธรรม  ควรปฏิบัติต่อกันด้วย จตนารมณ์ ห่งภราดรภาพ

Already there are new syllables and words emerging. You might recognise, ใน and เหตุผล.

Step 3: Look for syllables clustered around ◌ั◌. Bear in mind that some words will start with a consonant cluster.

มนุษย์ ทั้ง หลาย เกิดมามีอิสระ และ เสมอภาค กัน ใน เกียรติ ศัก ด และ สิทธิ ต่างมี เหตุผล และ ม โนธรรม และ ควรปฏิ บัติ ต่อ กัน ด้วย เจตนารมณ์ แห่งภราดรภาพ

Step 4: Look for syllables clustered around the other vowels. Remember to that some words have a leading .

ม นุษ ย์ ทั้ง หลายเกิดมามีอิ สระ และ เสมอภาค กัน ใน เกียรติ ศัก ด และ สิทธิต่างมีเหตุผล และ ม โนธรรม และ ควรปฏิ บัติ ต่อ กัน ด้วย เจตนา รมณ์ แห่ง ภ ราด ร ภาพ

There will probably be a few ambiguities here. For example, อิสระ could be อิ-สระ or อิส-ระ and โนธรรม could be โน-ธรรม or โนธ-รรม. Your knowledge of common and uncommon final consonants should usually help you in the right direction.

Step 5: Look at any fragments that haven't been accounted for.

 นุษ ย์ ทั้ง หลาย เกิด มา มี อิ สระ และ เสมอ ภาค กัน ใน เกียร ติ ศัก  และ สิท ธิ ต่าง มี เห ตุผล และ  โน ธรรม และ ควรปฏิ บัติ ต่อ กัน ด้วย เจต นา รมณ์ แห่ง  ราด  ภาพ

Fragment with ◌์ unambiguously belong with the preceding syllable. Single characters are probably from "unwritten /a/'s" and similar. So, looking at the beginning, we can presume that นุษย์ is a word มนุษย์ /maˑnút/, even if we don't know what it means.

As for ศัก, the is unlikely belong to the next syllable (และ), so (improbable as it may seem), we have a syllable ศักด with (presumably) the last consonant silent.

Then with โน we surmise that is followed by an unwritten /a/ and we have มโน /maˑnoo/.

As for ราด and ภาพ they might also be instances of unwritten /a/, so we may think we have ภราด and รภาพ (but we don't - see below).

We now have

มนุษย์ ทั้ง หลาย เกิด มา มี อิ สระ และ เสมอ ภาค กัน ใน เกียร ติ ศักด และ สิท ธิ ต่าง มี เห ตุผล และ มโน ธรรม และ ควรปฏิ บัติ ต่อ กัน ด้วย เจต นา รมณ์ แห่ง ภราด รภาพ