최신목록 받아보기 -> (버튼을 누르시면 HanRSS로 구독하실 수 있습니다)
- '지민아빠의 해처리..
아시다시피 자바는 유니코드 기반이다. 이 말은 보통 '자바언어의 내부적인 문자열 처리에 유니코드를 사용한다'라는 의미를 나타낸다. 자바언어의 문자열 처리는 java.lang.String 클레스를 통해서 이루어 진다. 이 클레스는 내부적으로 UTF-16 형식으로 문자열을 다룬다. (J2SE 5.0 이상 에서는 그렇다.) 이는 Java Language Spec 에 정해져 있으므로 OS 나 VM 벤더에 따라서 달라지지 않는다. 그러므로 자바(J2SE 5.0 이상)는 UTF-16 기반 이다.
정확히는 JDK 1.1 (Unicode 2.0), JDK 1.1.7 (Unicode 2.1), J2SE 1.4 (Unicode 3.0),J2SE 5.0 (Unicode 4.0) 이다.

사용자 삽입 이미지


이와는 조금 다른 이야기로 자바에서는 기본 file.encoding 값을 사용한다. IO를 사용할 경우 encoding 값을 명시적으로 사용하지 않는 경우 , 기본적으로 사용되는 encoding 값을 뜻하는데, 이는 JVM 이 시작할 때 지정하여 사용할 수도 있으며, 코드상에서 System.setProperty("file.encoding",<encoding>) 을 사용하여 바꿀 수 도 있다. 그리고 OS 나 VM 벤더에 따라서 다른 값을 사용 할 수도 있다. 요즘의 일반적인 시스템에서 자바의 file.encoding 값은 보통 UTF-8 값으로 되어 있다. 그래서 어떤 의미로는 자바를 UTF-8 기반이라고 말 할 수도 있지만, 여기에는 두가지 의미가 있을 수 있다는 것을 알아두면 좋을 것 같다.
글이 마음에 드신다면 한RSS구글리더로 편하게 구독하세요!!!