<br><br><div><span class="gmail_quote">On 8/31/07, <b class="gmail_sendername">Laurent Aimar</b> <<a href="mailto:fenrir@via.ecp.fr">fenrir@via.ecp.fr</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi,<br><br>On Fri, Aug 31, 2007, Rémi Denis-Courmont wrote:<br>> I have a few doubts concerning EITConvertToUTF8 (from<br>> modules/demux/ts.c). I have no access to the relevant specifications,<br>> neither to real-life streams using that.
<br> French TNT uses such descriptors and EITConvertToUTF8 is needed for<br>them.<br><br>> First, if the "string" starts with \x10\x00, it appears we assume the<br>> third byte codes the number of an ISO_8859 character set. Is there any
<br>> reason why this is limited to the range 1-15? As of now, there is also<br>> ISO_8859-16 (a.k.a. "Latin-10"), and who knows if more will not be<br>> added.<br>><br>> Second, if the string starts with \x11, we assume the rest is a sequence
<br>> of UTF-16. That being noted, iconv reckons three different kind of<br>> UTF-16. I am not sure, but I believe "UTF-16" needs a Byte-Order-Mark at<br>> the beginning, otherwise "UTF-16LE" and "UTF16-BE" must be used when
<br>> the byte endianess is arbitrarily specified.<br> It is described in EN 300 468 (DVB: Specification of Service Information in<br>DVB Systems) Annexe A (Selection of Charactere table).<br>[snip...]</blockquote><div>
<br>This is from an outdated version of the spec. I think perhaps the one I first used when  I implemented it.<br>Version 1.7.1 of the spec is the latest  release (at least it was this morning). <br></div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Notes:<br> For the first case, in real life ISO 8859-1 is used intead of ISO6937.<br>(Commentary from modules/access/dvb/en50221.c where you will find a the<br>original function)</blockquote><div><br>I'm quite sure I've seen both. Not sure how to deal with that. I think the best way is to
<br>comply with the spec and hopefully the broadcasters will start to format their strings properly<br>as the older STBs are faced out. At least one can hope.<br><br>Sigmund<br></div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
 About UTF-16, I have never seen it used. UTF-16 allows to insert a marker<br>at the start to specify LE or BE, so I hope that broadcasters use it.<br><br>--<br>fenrir<br><br>_______________________________________________
<br>vlc-devel mailing list<br>To unsubscribe or modify your subscription options:<br><a href="http://mailman.videolan.org/listinfo/vlc-devel">http://mailman.videolan.org/listinfo/vlc-devel</a><br></blockquote></div><br>