IT/개발

-file.encoding의 역할

알콩달콩아빠 2023. 9. 26. 11:45
728x90
반응형

1. java, jsp 소스 파일내의 다국어 표시

 

java, jsp 소스 파일의 인코딩과 JVM 실행시 -Dfile.encoding이 일치하지일치하지 않으면 소스 파일내의 한글이 제대로 표시되지 않는다.

 

따라서 -Dfile.encoding값을 모든 경우에 무조건 EUC-KR로만 지정해서는 안된다.

 

publicpublic class Tester {

 

public static void main(String[] args) {{

String fileEncoding=System.getProperty("file.encoding");

System.out.println("file.encoding = "+fileEncoding);"+fileEncoding);

String s="가나다";

System.out.println("s = "+s);"+s);

}

}

 

위 java 소스를 여러가지 case에서 실행한 결과는결과는 다음과 같다.

 

Case 1.

java 소스 파일 인코딩인코딩 : MS949

-Dfile.encoding : MS949(Windows default) or EUC-KR

 

==> 실행실행 결과

file.encoding = EUC-KR

s = 가나다

 

Case 2.

java 소스 파일 인코딩 : MS949

-Dfile.encoding : UTF-8

(ex. Windows에서 개발한 소스를, Linux에서 -Dfile.encoding을 명시하지 않고 실행)

 

==>==> 실행 결과

file.encoding = UTF-8

s = ??섎떎

 

Case 3.

java 소스 파일 인코딩 : UTF-8

-Dfile.encoding : UTF-8UTF-8

 

==> 실행 결과

file.encoding = UTF-8

s = 가나다가나다

 

Case 4.

java 소스 파일 인코딩 : UTF-8UTF-8

-Dfile.encoding : EUC-KR

 

==> 실행 결과

file.encoding = EUC-KREUC-KR

s =

(아예 콘솔에서 보이지 않는다.)

 

-------------------------------------------------------------------------------

 

2. 문자열 IO처리시 다국어 표시

 

파일이나파일이나 소켓 등으로 문자열 IO처리시, 문자열의 default charset은 -Dfile.encoding의 값을 따른다

 

new String(byte[] b) 또는 String getBytes() 실행시에도 default charset은charset은 -Dfile.encoding의 값을 따른다

 

public class EncodingTester1 {

 

public static void main(String[] args)throws Exception {

String String fileEncoding=System.getProperty("file.encoding");

System.out.println("file.encoding = "+fileEncoding);

 

InputStream is=new FileInputStream("c:/temp/kor.txt");

 

//Default charset은 file.encoding값을 따르게 된다

//만약 kor.txt 파일의 인코딩이 file.encoding과 다른 경우에는 한글이 깨져깨져 보인다

BufferedReader default_reader=new BufferedReader(new InputStreamReader(is));

 

//아래와 같이같이 InputStreamReader가 아닌 Reader를 사용하는 경우에는 항상 file.encoding값을 따른다

//BufferedReader default_reader=new BufferedReader(new FileReader("c:/temp/kor.txt"));

 

String kor=default_reader.readLine();

System.out.println("Default >> "+kor);"+kor);

 

is=new FileInputStream("c:/temp/kor.txt");

BufferedReader euc_reader=new BufferedReader(new InputStreamReader(is, "EUC-KR"));

kor=euc_reader.readLine();

System.out.println("EUC-KR >> "+kor);

 

is=new FileInputStream("c:/temp/kor.txt");

 

//kor.txt 파일의 인코딩이 file.encoding과 다른 경우에는 아래와 같이같이 charset을 명시해 주어야 한다

BufferedReader utf8_reader=newutf8_reader=new BufferedReader(new InputStreamReader(is, "UTF-8"));

kor=utf8_reader.readLine();

System.out.println("UTF-8 >> "+kor);

 

is=new is=new FileInputStream("c:/temp/kor.txt");

BufferedReader eng_reader=new BufferedReader(new InputStreamReader(is, "ISO-8859-1"));

kor=eng_reader.readLine();

System.out.println("ISO-8859-1 >> "+kor);

 

}

 

}

 

Case 1.

kor.txtkor.txt 파일 인코딩 : MS949

-Dfile.encoding : MS949

 

==> 실행 결과결과

file.encoding = MS949

Default >> 가나다라

EUC-KR >> 가나다라

UTF-8 >>>> ???????

ISO-8859-1 >> °¡³ª´?¶?

 

Case 2.

kor.txt 파일파일 인코딩 : UTF-8

-Dfile.encoding : MS949 or EUC-KR

 

==> 실행실행 결과

file.encoding = MS949

Default >> ???ㅻ

EUC-KR >> ???ㅻ?

UTF-8UTF-8 >> 가나다라

ISO-8859-1 >> ?°??굹?떌?씒?

 

출처 : -file.encoding의 역할 (tistory.com)

 
728x90
반응형