One of the greatest challenges is reading Thai is identifying word boundaries - particularly if you're reading a text with unfamiliar words. However, there are a few strategies that can help to identify syllable boundaries. When faced with an unfamiliar text here are a few things you can try:
1. Scan for common grammatical wordsThis will break each phrase into shorter, more manageable pieces. These words include:
ก็ ไม่ ให้ ได้ ไป ที่ กับ นี้ นั้น ยัง เป็น ว่า อยู่ แต่ แล้ว และ จะ
As you spend more time reading Thai your list of such words will expand.
Note that most of these words have an above vowel or tone mark. Generally, it's best to start looking above the characters before diving into more detail.
2. Identify syllable boundariesThe following characters mark the start of a syllable: เ◌, แ◌, โ◌, ใ◌, ไ◌
And the following ones mark the end of a syllable: ◌ ำ, ◌ะ
3. Look for syllables clustered around ◌ัBecause ◌ั◌ is always preceded and followed by a consonant it's a handy way further to break down sentences. Remember to look for possible consonant clusters before ◌ั◌.
4. Look for syllables clustered around the other vowelsAll vowels are associated with at least one consonant. The may be associated with a consonant cluster before, and (optionally) a consonant after.
5. Look at any fragments that haven't been accounted forSuch fragments must be associated with a preceding or following syllable. Adjust boundaries to address this.
6. Identify words from the syllablesLet's apply that technique to a short text (namely the first item of the Universal Declaration of Human Rights). Here's the original text:
Step 1: Scan for common grammatical words (shown in dark blue) we get:
มนุษย์ทั้งหลายเกิดมามีอิสระ และ เสมอภาคกันในเกียรติศักด และ สิทธิ ต่างมีเหตุผล และ มโนธรรม และ ควรปฏิบัติต่อกันด้วยเจตนารมณ์แห่งภราดรภาพ
Step 2: Identify syllable boundaries using เ◌, แ◌, โ◌, ใ◌, ไ◌ ◌ ำ, ◌ะ
มนุษย์ทั้งหลาย เกิดมามีอิสระ และ เสมอภาคกัน ใน เกียรติศักด และ สิทธิ ต่างมี เหตุผล และ ม โนธรรม และ ควรปฏิบัติต่อกันด้วย เจตนารมณ์ แห่งภราดรภาพ
Already there are new syllables and words emerging. You might recognise, ใน and เหตุผล.
Step 3: Look for syllables clustered around ◌ั◌. Bear in mind that some words will start with a consonant cluster.
มนุษย์ ทั้ง หลาย เกิดมามีอิสระ และ เสมอภาค กัน ใน เกียรติ ศัก ด และ สิทธิ ต่างมี เหตุผล และ ม โนธรรม และ ควรปฏิ บัติ ต่อ กัน ด้วย เจตนารมณ์ แห่งภราดรภาพ
Step 4: Look for syllables clustered around the other vowels. Remember to that some words have a leading ห.
ม นุษ ย์ ทั้ง หลาย เกิด มา มี อิ สระ และ เสมอ ภาค กัน ใน เกียร ติ ศัก ด และ สิท ธิ ต่าง มี เห ตุผล และ ม โนธรรม และ ควรปฏิ บัติ ต่อ กัน ด้วย เจต นา รมณ์ แห่ง ภ ราด ร ภาพ
Step 5: Look at any fragments that haven't been accounted for.
ม นุษ ย์ ทั้ง หลาย เกิด มา มี อิ สระ และ เสมอ ภาค กัน ใน เกียร ติ ศัก ด และ สิท ธิ ต่าง มี เห ตุผล และ ม โน ธรรม และ ควรปฏิ บัติ ต่อ กัน ด้วย เจต นา รมณ์ แห่ง ภ ราด ร ภาพ
Fragment with ◌์ unambiguously belong with the preceding syllable. Single characters are probably from "unwritten /a/'s" and similar. So, looking at the beginning, we can presume that ม นุษ ย์ is a word มนุษย์ /maˑnút/, even if we don't know what it means.
As for ศัก ด, the ด is unlikely belong to the next syllable (และ), so (improbable as it may seem), we have a syllable ศักด with (presumably) the last consonant silent.
Then with ม โน we surmise that ม is followed by an unwritten /a/ and we have มโน /maˑnoo/.
As for ภ ราด and ร ภาพ they might also be instances of unwritten /a/, so we may think we have ภราด and รภาพ (but we don't - see below).
We now have
มนุษย์ ทั้ง หลาย เกิด มา มี อิ สระ และ เสมอ ภาค กัน ใน เกียร ติ ศักด และ สิท ธิ ต่าง มี เห ตุผล และ มโน ธรรม และ ควรปฏิ บัติ ต่อ กัน ด้วย เจต นา รมณ์ แห่ง ภราด รภาพ