레이블이 최적화인 게시물을 표시합니다. 모든 게시물 표시
레이블이 최적화인 게시물을 표시합니다. 모든 게시물 표시

2022년 5월 15일 일요일

프로파일링 데이터 엑셀 추출 툴

 프로파일링 데이터 엑셀 추출 툴

https://github.com/do-won-kim/Tools/tree/main/Profiling


한창 최적화를 할 때 테스트 데이터를 저장해서 필요한 장소만 수정 할 수 있도록 엑셀 데이터를 뽑는 툴을 만든 적이 있었는데 이 후 다른 작업을 하게되면서 잊고 있었는데 갑자기 생각이 나서 odin 제거하고 기본 유니티에디터 스크립트로 수정한 버전

유니티 에디터에서 촬영하는 버전과 android와 연결해서 촬영하는 버전 두개가 있다.

자세한 사용방법은 깃허브의 리드미로 대체 합니다.

2021년 8월 2일 월요일

GC Alloc를 줄이자

 GC Alloc를 줄이자


CPU 최적화를 최대한 해주기 위해서 GC Alloc를 최대한 줄일려고 노력을 한 적이 있었다.
그 중에서 GC Alloc를 천 단위로 계속 호출해서 프레임에도 심한 영향을 준 케이스와 백 단위로 계속 호출해서 약한 영향을 준 케이스가 2개 있어서 적어볼려고 한다.

첫번째 심했던 케이스는
-string 끼리 더하는 코드 예시-

-해당 코드 프로파일링 결과-

공부를 하다보면 누구나 한번쯤 들어봤을 string 끼리 더하는 코드였다.
발견 당시에 2년 넘게 개발중인 게임에서 이런 식의 코드가 있었다는게 좀 황당했던 기억이 남아있다.

형태에 따라 stringbuilder를 사용해도 상관없지만 당시에는 구조를 조금 바꿔서 아예 지워버렸던 것으로 기억한다.

의외로 별거 아니라고 생각하는 사람도 있는데 update문이나 자주 사용하는 함수의 for문등에 사용 할때는 문제가 될 수 있으므로 그냥 해당 형태를 최대한 피하는 것이 좋다.

두번째 케이스는 
-AddRange와 FindAll을 반복해서 사용 하는 형태-


-해당 코드 프로파일링 결과-

두번째도 마찬가지로 update문에서 돌아가는 코드였는데 addrange와 findall을 사용하는 형태였다.
사실 개인적으로 저것을 자주 사용하지 않아서 GC Alloc를 유발하는지 모르고 있었는데 프로파일링을 하다보니 알게 되었다.
해당 코드의 수정방법은 다소 무식하게 하면 간단하다.

-2중 For문과 if조건문으로 수정한 코드-

                                           -해당 코드 프로파일링 결과-

좀 코드가 길어지더라도 for문을 한번 더 사용해서 같은 결과만 나오게 해주면 해결된다 그리고 실제 코드에서 리스트 초기화하는 부분도 따로 빠져있지 않았어서 불편해서 수정했다.

회사에서 이렇게 프로파일링을 해서 코드들을 수정하고 나서부터는 이러한 것들이 한번 호출하고 끝나는 코드에서는 별 상관 없지만 습관이 생긴다고 평소에도 의식하면서 코드를 짜게 만들어 주었다.

혹시 이글을 보게 된다면 자신의 게임의 GC Alloc call을 한번쯤 확인해보는 것은 어떨까

2021년 7월 21일 수요일

Unity Text(UIVertex[]) Memory Leak

 Unity Text(UIVertex[]) Memory Leak


메모리 검사를 하던 중 씬을 이동 할때 마다 uivervex[] 라는 항목이 계속 증가하는 것을 확인했는데 따로 text를 저장하는 코드가 없어서 많이 해매였다.

-테스트용 씬 스크립트-

간단한 테스트용 스크립트를 만들었다 폰트를 변경하고 버튼을 누르면 B씬을 불러오고 그 씬에서도 폰트를 변경하고 다시 A씬으로 돌아오는 것을 반복하는 스크립트이다.


-처음 프로파일러에 잡히는 uivertex-

-씬을 여러차례 이동 후에 잡히는 uivertex-

테스트 씬에서 재현을 한 후에 레퍼런스 연결을 따라가보니 FontUpdateTracker 라는 곳에서 해당 텍스트들을 전부 들고 있는 걸 확인했는데 해당 스크립트는 유니티 스크립트라 유니티에서 함수 내부를 확인하지는 못했고 깃허브를 이용해 스크립트를 찾을 수 있었다.(https://github.com/liuqiaosz/Unity/blob/master/UGUI%E6%BA%90%E4%BB%A3%E7%A0%81/UnityEngine.UI/UI/Core/FontUpdateTracker.cs)

보자마자 (static Dictionary<Font, List<Text>> m_Tracked) 해당 딕셔너리가 문제가 있는게 보였고 Add하는 부분과 Remove하는 부분을 찾아보니 몇 군데 있었지만 중요한건 enable과 disable 그리고 font를 수정할 때 add를 하거나 remove를 하는데 여기서 문제였던게

우리 게임에서는 폰트를 코드로 추가해주는데 해당 컴포넌트가 들어가있는 오브젝트가 꺼져있든 켜져있는 수정을 해주는데 이때 add가 되고 만약에 해당 오브젝트가 켜지기 전에 씬을 이동할 경우 disable이 동작하지 않기 때문에 딕셔너리에서 빠지지 않아서 계속 쌓이는 것이였다.

원인을 찾았으니 수정을 해주면된다.

-수정된 폰트 교체 코드-

여기서 FontUpdateTracker.UntrackText는 딕셔너리에서 텍스트를 빼주는 역할을 한다. 꺼져있는 텍스트의 경우 수동으로 처리를 해주는것이다.

수정 후에 재 테스트를 하였다.

-재 테스트 결과-

위에 있던 이미지와 같은 이미지가 아니다 이번에는 확실히 여러번 이동 했음에도 메모리가 정상적으로 빠지는 것을 확인 할 수 있었다.

해당 내용이 비록 작은 게임에서는 그렇게 큰 메모리 문제로 나타나지 않을 수 있으나 텍스트가 많을 경우 그리고 씬을 자주 이동할 경우 심하면 계속 같은 양 만큼 증가 하기 때문에 10mb 20mb 30mb 씩 늘어나는 경우도 있었는데 이러한 내용을 알려주지 않은 유니티에 당황스럽기도하고(어디 있는데 못찾은 걸 수도 있다.) ondestroy에 remove를 넣거나 add할때 if문 하나만 걸어줘도 방지 할 수 있는 걸 지금까지 방치한것도 문제가 있어보인다.

해당 사항은 추후에 다시 정리해서 버그리포트에 올릴 계획입니다.


















2021년 7월 16일 금요일

Bloom Shader 최적화

 Bloom Shader 최적화

유니티의 다양한 기본 포스트 프로세싱 중에 Bloom이라는 기능이 있다.

광원에 좀 더 효과를 주는 기능인데 잘 조절 하면 이쁘게 나오지만 성능에 제법 부하를 주는 친구다. 특히 게임이 모바일이라면 더욱 더

우선 Bloom 효과를 적용하고 프레임 디버그를 이용해 확인 해보면 다음 과 같은 결과를 볼 수 있다.
-프레임 디버그로 확인한 Bloom-

여러장의 텍스처를 이용해 찍어내는데 메모리도 있지만 draw call도 상당히 증가하고 덕분에 프로파일러를 통해 확인해보면 

-프로파일러로 확인한 Bloom-


괜찮은 성능의 pc에뮬로 기본 씬에서 찍어도 0.5~1.0ms를 차지한다.
실제 개발중인 모바일게임 프로파일링 당시에는 많게는 8ms를 차지 하기도 했다.(8ms면 30프레임 기준으로 혼자서 1/4을 차지 하는 수준이다.)

그러면 이러한 문제를 어떻게 해결할 수 있을까
답은 간단하다 Bloom이 찍는 텍스처 수를 줄이면 된다.

-PostProcessPass-

Package - Universal RP - Runtime -  Passes - PostProcessPass.cs
해당 스크립트의 50번째 줄 정도를 보면 k_MaxPyramidSize라는 변수가 있다.

해당 변수가 Bloom효과를 적용할 때 횟수를 정해준다 과감하게 2로 줄인다.


-2로 줄인 후의 결과-

Draw call은 22 -> 4로 감소 하였고, 0.5ms -> 0.1ms로 감소 하였다.
실제 모바일게임에서는 8ms에서 1ms까지 감소하는 효과를 보여주었다.

물론 해당 방법을 사용하게 되면 적용되는 Bloom효과가 다소 다르게 보여지기 때문에 수치 조절은 다시 해줘야한다.

해당 기능 성능이 다소 부담되기도 하고 줄여도 어느 정도 수치 조절로 커버가 가능한 모바일 게임에서 유용하게 사용 할 수 있을 것으로 보인다.

해당 수정사항들은 패키지 파일의 스크립트를 수정 하는 것이니 패키지 파일을 Package 폴더로 따로 이동해 custom하게 사용을 해야한다.(그렇지 않으면 유니티를 재부팅하면 원상복구된다.)

2021년 7월 13일 화요일

쉐이더 메모리 최적화

쉐이더 메모리 최적화

쉐이더에는 multi_compile와 shader_feature 라는 기능이 있다.

쉐이더의 베리언트를 나눠서 하나의 쉐이더에서 여러 기능을 구현 할 수 있도록 해주는 것인데 둘의 차이라면 multi_compile는 모든 분기가 빌드에 포함되고 shader_feature 사용중인 분기만 빌드에 포함된다는 것이다.

그러면 shader_feature 만 쓰면 된다고 생각 할 수도 있지만 런타임중에 분기가 바뀌는 경우에는 shader_feature 의 경우 빌드에 포함되지 않았기 때문에 동작이 제대로 되지 않는다.

그렇다고 multi_compile를 전부 쓰면 쉐이더의 베리언트가 배로 계속 늘어 무식하게 커지게 된다.

pc게임이라면 어느정도 사이즈는 신경 쓰지 않을 수 있지만 회사에서 모바일 게임을 개발 중이기 때문에 민감하지 않을 수 가 없었다.

-Unity Urp Lit Shader-

빌트 인 쉐이더의 standard 쉐이더를 대체하는 urp의 기본 lit 쉐이더의 기본 베리언트들이다.
일반적인 게임에서는 그냥 사용해도 별 무리가 없으나 해당 쉐이더를 개조해서 게임에서 사용중이 였기 때문에 multi_compile로 더늘고 최종본에서는 최대 140mb 가까이 메모리를 먹었었다.

이 경우 필요없는 베리언트들을 줄이는 작업을 해주면 좋다.

-수정된 Lit Shdaer-

_MAIN_LIGHT_SHADOWS_CASCADE
캐스케이드 관련 키워드이다 모바일게임이다 보니 사용하지 않아 지웠다.

_ADDITIONAL_LIGHTS
_ADDITIONAL_LIGHTS_VERTEX는 사용하지 않아서 지웠다.

_ADDITIONAL_LIGHT_SHADOWS
추가 라이트의 그림자는 지원하지 않아서 지웠다.

_MIXED_LIGHTING_SUBTRACTIVE, DIRLIGHTMAP_COMBINED, LIGHTMAP_ON
라이트맵 관련 키워드인데 라이트맵을 사용하지 않아 지웠다.

multi_compile_instancing
GPU instancing 기능을 사용할 때 사용하는 키워드인데 어차피 srp를 사용할거기 때문에 제거했다.(terrain의 경우 srp적용이 안되서 terrain lit 쉐이더를 수정할 경우 남겨둔다.)


기본 lit 쉐이더에서 해당 작업을 진행 할 경우 베리언트 수가 9로 줄어 들게 된다.
모든 기본 쉐이더에서 해당 작업을 진행하면 제법 쏠쏠한 이득을 챙길 수 있다.

해당 수정사항들은 패키지 파일의 스크립트를 수정 하는 것이니 패키지 파일을 Package 폴더로 따로 이동해 custom하게 사용을 해야한다.(그렇지 않으면 유니티를 재부팅하면 원상복구된다.)








2021년 7월 10일 토요일

어드레서블과 아틀라스(레거시) 최적화 문제

어드레서블과 아틀라스(레거시) 최적화 문제


-테스트 용으로 빌드한 apk의 메모리 프로파일러 같은 아틀라스가 3개 올라와있다.-


 메모리 최적화를 위해 메모리 프로파일링을 하던 도중 아틀라스가 중복되서 올라오는 현상을 발견했다.

워낙 큰 아틀라스라 처음에는 여러장 있는 건줄 알고 있었으나 같은 아틀라스인 걸 확인 후에 레거시는 새로나온 V2처럼 수동조작으로 하는게 아닌데 왜 중복으로 올라가는지 찾아본 결과

어드레서블을 이용해 번들을 나눌 때 파일 형식 별로 갯수와 용량을 맞추었는데 아틀라스가 같은 스프라이트가 번들이 나눠져 있을 경우 나눠진 만큼 아틀라스도 중복되서 올라가는 것이였다.

-같은 아틀라스를 쓰는 스프라이트를 같은 번들에 모두 넣었을 때 메모리가 하나만 올라갔다-

스프라이트의 경우 아틀라스가 없으면 일정 갯수대로 있으면 아틀라스 별로 번들 그룹을 정하는 것으로 해결


- 참고1 테스트용 apk를 만들면서 이상한 점을 발견했는데 빈 프로젝트에 아틀라스 패킹을 하고 번들을 찢어 놓으면 메모리가 여러개 올라가지 않고 하나만 올라갔다는 점이다.

이상해서 이것 저것 테스트 하던 와중 번들내에 있는 스프라이트를 하나 어드레서블 로드를 했을 때 갑자기 여러장이 올라가서 이게 문제 인가 했지만 테스트 했던 코드를 모두 지우고 다시 빌드 했을 때도 여전히 여러장의 메모리가 올라가는 것을 확인했다.

유니티는 정말 봐도 봐도 신기하다는걸 이번 테스트로 다시 확인 했다.

결국 정확한 원인은 파악하지 못했지만 해결 방법은 같은 아틀라스를 쓰는 스프라이트들은 같은 번들에 넣는 걸로 해결이 가능하였다.

- 참고2 해당 문제는 apk빌드 후에 프로파일링을 해야 발견 됐다 에디터에서는 간혹 캐쉬가 남아서 한두개 더 찍히기도 했지만 껐다가 키면 다시 아틀라스가 하나씩만 메모리에 올라가는 것을 확인 하였다.