법선 벡터와 마찬가지로 삼각형의 정점마다 텍스처 좌표를 지정해주면 보간에 의해 삼각형의 모든 점마다 그에 대응되는 텍스처 좌표가 결정된다.
9.3 텍스처 자료 원본
DDS (DirectDraw Surface format)가 지원하는 기능
1. GPU가 직접 해제할 수 있는 압축 형식
2. 밉맵
3. 텍스처 배열
4. 입방체 맵
5. 입체 텍스처
9.4 텍스처 생성 및 활성화
텍스처 자원은 CreateDDSTextureFromFile12 함수로 생성
Texture 구조체는 Light과 Material과 달리 텍스처 자원의 포인터와 업로드 힙(자원 생성 시 기본 힙으로 복사하기 위한)의 텍스처 자원 포인터를 가지고 있다.
CreateDefaultBuffer 함수를 사용해서 정점 버퍼를 기본 힙에 복사하고 업로드 힙의 임시자원과 기본 힙에 복사된 정점 버퍼 자원을 가리키는 포인터를 MeshGeometry 구조체가 가지는 것과 비슷하게
CreateDDSTextureFromFile12 함수를 사용해서 텍스처 자원을 기본 힙에 복사하고 Texture 구조체는 업로드 힙의 자원과 텍스처 자원의 포인터를 출력 매개변수로 얻는다.
자원을 생성했으면 SRV 서술자 힙과 SRV 서술자 힙을 만든다.
텍스처를 파이프라인에 묶기
재질을 상수 버퍼에서 가져오기 때문에 한 번의 그리기에 동일한 재질만 사용할 수 있는 제한된 방식을 사용하지 않고 재질 자료를 텍스처 맵에서 가져오는 방법
상수버퍼의 DiffuseAlbedo(분산 반사율)은 그대로 사용할 수 있다. 텍스처에서 얻은 분산 반사율과 곱하여 사용
(텍스처에 색을 입힐 수 있는 방법) (상수 버퍼의 분산 반사율이 (1, 1, 1, 1)이면 그대로)
Material 구조체에 사용할 분산광 반사율 텍스처 맵의 색인(SRV 힙에서의)을 저장한다.
9.5 필터
밉맵 필터링 설정
점 필터링 (point)
ㄴ 화면의 투영된 기하구조의 해상도에 가장 가까운 밉맵 수준을 사용하는 방식
선형 필터링 (linear)
ㄴ 화면의 투영된 기하구조의 해상도에 가장 가까운 이웃한 두 밉맵 수준을 각각 선형 보간해서 텍스처 색상 하나씩 뽑은 다음에 두 밉맵 수준을 보간하여 최종 색상 결정
비등방 필터링 (anisotropic)
ㄴ 법선 벡터와 카메라의 시선 벡터 사이의 각도가 클 때 발생하는 왜곡 현상이 완화된다.
9.6 텍스처 좌표 지정 모드
텍스처 좌표의 정의역 [0, 1] 바깥의 좌표가 주어졌을 때의 처리 방식
1. 순환
2. 테두리 색상
3. 한정
4. 반사
9.7 표본추출기 객체
텍스처 필터링과 좌표 지정 모드를 지정하는 객체
표본 추출기를 생성하는 방법
1. 표본 추출기 힙에 표본 추출기 서술자를 설정하고 레지스터 슬롯에 묶어 셰이더로 보내는 방법
2. 정적 표본추출기를 사용
ㄴ 표본 추출기 배열을 만들어 사용, 표본 추출기 힙을 설정하지 않아도 됨
ㄴ 테두리 색상 설정에 제한이 있음
9.8 셰이더에서 텍스처 표본 추출
하나의 SRV가 Texture2D 객체에 묶인다.
텍스처로부터 한 픽셀의 텍스처 좌표 (u, v)가 주어졌을 때 Sample메서드를 이용해서 그 픽셀에 해당하는 표본을 텍스처로부터 실제로 추출한다.
9.10 텍스처 변환
정점 셰이더에서 입력 텍스처 좌표를 변환하는데 쓰이는 상수 버퍼 변수
비례 행렬을 적용하면 텍스처를 타일 방식으로 입힐 수 있다.
텍스처의 간단한 애니메이션을 구현하는데 좋다.
gTexTransform
gMatTransform // 재질에 대해 텍스처 변환을 적용하는 것이 합당한 경우
연습문제
2.
level 0 ~ level 4로 5개의 밉맵을 가진 dds파일을 만들었다.
멀리서 바라봤을 때는 가장 작은 레벨의 밉맵으로 면이 채워진다
점 밉맵 필터링을 사용한 경우 정육면체의 오른쪽 면을 기준으로
시점에서 가까운 쪽의 면의 일부분은 가장 가까운 수준의 밉맵이 3레벨 밉맵이고
먼 쪽 면의 일부분은 가까운 밉맵이 4레벨 밉맵이어서 경계가 생긴다.
선형 밉맵 필터링을 사용한 경우 하나의 밉맵을 선택하는 것이 아니라 가까운 두 밉맵의 텍스처 색상을 보간하기 때문에
두 밉맵이 섞여 보인다.
3. 다중 텍스처 적용
두 텍스처의 성분별 곱셈으로 새로운 텍스처를 만들어낸다.Default.hlsl를 수정하여 텍스처를 하나 더 받도록 한다.Default.hlsl의 픽셀 셰이더 부분에서 두 텍스처를 성분별로 곱한다.두 개의 텍스처 파일을 불러와 자원을 만든다.srv 힙의 크기를 2로 늘리고 각각의 텍스처에 대한 서술자를 만든다.루트 매개변수로 서술자 테이블을 사용했고 t0, t1레지스터에 담아서 보낸다.
4.
텍스처 좌표는 xy 평면에 존재하므로 z축을 기준으로 회전하는 행렬을 적용한다.
각도 theta를 totalTime()으로 지정했기 때문에 2π초마다 한바퀴를 돈다.
Z축 기준 회전을 할때 x= 0.5, y =0.5 (화염구의 중심)을 기준으로 회전시키고 싶기 때문에 x, y 각각 -0.5 씩 이동변환 시킨후 회전하고, 다시 +0.5씩 이동변환 시켜 제자리로 돌아오게 한다.
매 프레임 CPU가 수정해야 하는 자원들을 순환 배열로 관리하여 CPU와 GPU가 놀지 않도록 하기
프레임 자원마다 명령 할당자가 필요하다. (GPU가 명령을 다 처리하지 않았어도 다음 프레임 자원을 수정해야 하기 때문에)
상수 버퍼를 매 프레임 수정한다면 프레임 자원마다 상수 버퍼가 필요하다.
void ShapesApp::Update(const GameTimer& gt)
{
OnKeyboardInput(gt);
UpdateCamera(gt);
// Cycle through the circular frame resource array.
// Update 함수 호출 될때마다 다음 인덱스의 프레임 자원이 현재 프레임 자원이 됨
mCurrFrameResourceIndex = (mCurrFrameResourceIndex + 1) % gNumFrameResources;
mCurrFrameResource = mFrameResources[mCurrFrameResourceIndex].get();
// Has the GPU finished processing the commands of the current frame resource?
// If not, wait until the GPU has completed commands up to this fence point.
// CPU 처리속도가 GPU 처리속도보다 빨라서 한 바퀴를 돌았는데도 아직도 안 끝난 경우에는 기다림
if(mCurrFrameResource->Fence != 0 && mFence->GetCompletedValue() < mCurrFrameResource->Fence)
{
HANDLE eventHandle = CreateEventEx(nullptr, false, false, EVENT_ALL_ACCESS);
ThrowIfFailed(mFence->SetEventOnCompletion(mCurrFrameResource->Fence, eventHandle));
WaitForSingleObject(eventHandle, INFINITE);
CloseHandle(eventHandle);
}
UpdateObjectCBs(gt);
UpdateMainPassCB(gt);
}
void ShapesApp::Draw(const GameTimer& gt){
// 현재 프레임의 명령 목록들을 구축하고 제출
mcurrFrameResource->Fence = ++mCurrentFence; // CPU는 현재 프레임 명령 제출을 끝냈음
mCommandQueue->Signal(mFence.Get(), mCurrentFence); // GPU기준 마지막으로 끝낸 프레임 작업 번호가 무엇인지 설정
7.2 렌더 항목 (RenderItem 구조체)
하나의 물체를 그리는데 필요한 설정들을 모아놓은 구조체
1. 물체의 세계 행렬
2. numframesDirty // 물체의 자료가 변해서(위치가 이동했거나 한 경우) 상수 버퍼를 갱신해야 하는 경우 numframesdirty 값을 프레임 자원의 개수로 설정하면 된다.
update문에서 모든 renderitem들의 numframesdirty 값을 확인하는데 값이 0보다 크다면 해당 renderitem이 사용하는 상수 버퍼의 값을 갱신하고 numframesdirty 값을 -1 시킨다. CPU가 프레임 자원을 한바퀴 돌면 모든 프레임 자원의 상수 버퍼 값은 갱신된다.
3. 기하구조 (Mesh Geometry) (GPU와 CPU 메모리에 기하구조가 사용하는 정점 버퍼와 색인 버퍼 자원을 만들게 되는데
이 자원들을 가리키는 Com객체를 멤버로 가지고 있는 구조체)
4. 기본도형 위상구조
5. GPU상 해당 RenderItem이 사용하는 상수 버퍼의 index
7.3 물체별 상수 버퍼와 패스별 상수 버퍼
물체별 상수 버퍼는 물체의 world행렬만 가지고 있으면 된다.
패스별 상수 버퍼는 시점 위치, 시야 행렬, 투영 행렬, 화면 크기, 게임 시간 측정치 등 한 프레임에 한번만 수정되는 상수 자료를 가진다.
7.4 도형 기하구조
원기둥 메시
구 메시
측지구 메시
7.5 도형 예제
7.7 지형과 파도 예제
7.6 루트 서명 추가 설명
이전 장에서 다 설명함
서술자 테이블
루트 상수
루트 서술자
ㄴ 서술자 테이블에서는 자원을 묶을 때 서술자 힙의 핸들을 묶어 줬지만 루트 서술자는 그냥 자원의 가상 주소를 묶으면 된다. (업로드 힙에 올린 상수 버퍼 자원의 서술자 힙을 만들지 않고도 가능한 방법이다.)
7.7.5 동적 정점 버퍼
파도 구현할때, 복잡한 물리계산과 충돌 검출을 수행해서 입자들의 새 위치를 구할때
상수 버퍼들의 배열을 업로드 힙에 올리는 방법과 유사하다. 이번에는 정점들의 배열을 업로드 버퍼에 담는다.
동적 버퍼를 사용하면 CPU에서 새 자료를 GPU 메모리에 전송하는 데 추가 부담이 발생하므로 정적 버퍼로 충분 할때에는 정적 버퍼를 사용하자
1. 간단한 애니메이션은 정점 셰이더에서 수행할 수 있다.
2. 텍스처로의 렌더링 기능이나 계산 셰이더 또는 정점 텍스처 조회 기능을 이용할 수 있다.
3. 기하 셰이더를 이용하면 GPU에서 기본도형의 생성 및 파괴 작업을 GPU에서 할 수 있다.
4. 테셀레이션 단계를 이용하면 GPU에서 세밀한 기하구조를 추가할 수 있다.
응용 프로그램에서 update뒤에 draw가 실행되므로
update에서 매 프레임 정점 버퍼를 업로드 힙에 갱신하고 draw하면 된다.
연습문제
1.
세부수준 0 1
세부수준 2 3
2.
셰이더 파일에서 상수 0번 레지스터가 받는 형식정점 셰이더 부분DrawRenderItems함수에서 각각의 renderitem의 world 행렬 갱신하는 부분루트 서명 작성하는 부분
자원의 종류는 텍스처와 버퍼 두가지로 나누어져 있는데, 버퍼는 밉맵과 달리 다차원이 아니며 밉맵이나 필터, 다중표본화 기능이 없어 단순한 자원이다. 정점 자료 원소의 배열을 CPU에 제공할 때에는 항상 버퍼를 사용한다.
범용 GPU 자원으로서의 버퍼에서 너비(width)는 가로 길이가 아니라 버퍼의 바이트 개수를 뜻한다.
정적 기하구조(프레임마다 변하지 않는 기하구조)를 그릴 때에는 최적의 성능을 위해 정점 버퍼들을 기본 힙(D3D12_HEAP_TYPE_DEFAULT)에 넣는다. 기본 힙은 GPU만 읽기 때문에 CPU가 기본 힙을 수정하지 못한다.
d3dUtil.cpp에 기본 힙의 자료를 초기화 하기 위한 CreateDefaultBuffer함수가 정의되어 있다.
1. 임시 업로드 힙에 버퍼를 만들고
2. D3D12_SUBRESOURCE_DATA 라는 임시 자료를 위한 구조체를 서술
3. 자원 장벽 명령으로 기본힙의 버퍼 상태를 COMMON에서 COPY_DEST로 변경
4. UpdateSubresources 함수는 CPU 메모리를 임시 업로드 힙에 복사하고 임시 업로드 힙의 자료를
기본 힙의 버퍼와 업로드 힙의 버퍼는 이 함수 밖에서도 Comptr로 가리키고 있어야 한다. 실제로 명령 목록이 명령 대기열에 들어가 실행된 상태가 아니기 때문이다. 함수 내부에서 만들어진 기본 힙의 버퍼를 가리키는 Comptr를 이 함수가 반환하기 때문에 소유권을 넘길 수 있다. 아무튼 외부에 존재하는 두 버퍼에 대한 Comptr가 유지되어야 한다.
정점 자원을 서술하는 서술자는 서술자 힙이 필요없다.
D3D12_VERTEX_BUFFER_VIEW 구조체를 서술하고(버퍼 자원의 가상주소, 버퍼의 크기(vertex 구조체 크기 * 정점 개수), 정점 원소의 크기(vertex 구조체 크기))
cmdList->IASetVertexBuffers 함수의 매개변수로 위의 구조체로 만든 배열의 주소를 입력하면 각 정점 버퍼들이 슬롯에 차례대로 묶인다.
cmdList->IASetPrimitiveTopology 함수로 기본도형 위상구조 상태를 set 시켜놔야 한다.
cmdList->DrawInstanced가 호출되어야지 그때 그려진다.
ㄴ 인덱스 없이 정점 버퍼에 있는 정점 순서대로 기본도형을 그린다.
6.3 색인 버퍼
만드는 방식은 정점 버퍼와 같은데 이름만 다르다
D3D12_INDEX_BUFFER_VIEW 구조체를 서술해야하고,
cmdList->IASetIndexBuffer 함수를 사용한다.
색인들을 이용해 기본도형을 그리려면, DrawIndexedInstanced 함수를 사용해야 한다.
인덱스로 접근하기 때문에 다음의 3가지 정보를 사용한다.
1. 첫 정점의 위치
2. 첫 인덱스의 위치
3. 기하구조를 그리는데 사용하는 인덱스의 크기
여러 종류의 기하구조를 하나의 정점 버퍼와 색인 버퍼에 저장하더라도 기하구조를 그리는 첫 번째 정점의 위치와 인덱스 위치를 기록해놓으면 문제가 없다.
6.4 정점 셰이더
기본적인 정점 셰이더의 역할은 로컬 position을 동차좌표 position으로 변환하여 픽셀 셰이더에 전달하는 것이다.
셰이더 파일은 포인터나 참조가 없어서 out float oPosH와 같은 출력 매개변수를 사용한다.
VertexOut VS(VertexIn vin)
{
VertexOut vout;
// Transform to homogeneous clip space.
vout.PosH = mul(float4(vin.PosL, 1.0f), gWorldViewProj);
// float3 형식의 로컬 position의 w값을 1로 하여 float4값을 생성하고 세계시야투영행렬을 곱한다.
// Just pass vertex color into the pixel shader.
vout.Color = vin.Color;
return vout;
}
정점 셰이더가 필요로 하는 입력서명을 입력 배치서술이 모두 제공하지 않으면 오류가 발생한다.
동차 절단 공간에서의 정점의 위치를 값는 출력 매개변수는 SV_POSITION 의미소를 부여해야 한다.
6.5 픽셀 셰이더
정점 셰이더에서 출력한 정점 특성들은 래스터화 단계에서 삼각형의 픽셀들을 따라 보간되어 보간된 결과가 픽셀셰이더의 입력으로 들어온다.
float4 PS(VertexOut pin) : SV_Target
{
return pin.Color;
}
// SV_TARGET : 이 함수의 반환값의 형식이 렌더 대상의 형식과 일치해야 함을 뜻한다.(4차원의 색상 값)
6.6 상수 버퍼
셰이더 프로그램에서 참조하는 자료를 담는 GPU 자원
정점 버퍼와 색인 버퍼와 달리 상수 버퍼는 프레임당 한 번 갱신하는 것이 일반적임(기본 힙이 아니라 업로드 힙에 만들어야 CPU가 버퍼의 내용을 갱신할 수 있음)
하드웨어가 256 * n 바이트 오프셋에서 시작하는 256 * n 바이트 길이의 상수 자료만 볼 수 있기 때문에 상수 버퍼의 원소는 256바이트의 배수여야 한다.
cbuffer cbPerObject : register(b0)
{
float4x4 gWorldViewProj; // 256바이트 경계에 맞게 바이트들이 암묵적으로 채워진다.
};
바이트 배열의 특정 위치(256 * 오프셋) 상수 버퍼 구조체를 memcopy하여 복사하면 된다.
6.6.4 상수 버퍼 서술자
상수 버퍼 서술자는 DESCRIPTOR_HEAP_TYPE_CBV_SRV_UAV 형식의 서술자 힙에 담긴다.
DESCRIPTOR_HEAP_TYPE_DESC를 서술하여 서술자 힙을 만들 때
Type을 DESCRIPTOR_HEAP_TYPE_CBV_SRV_UAV로 해줘야 하고
Flags를 D3D12_DESCRIPTOR_HEAP_FLAG_SHADER_VISIBLE로 해줘야 한다.(셰이더 프로그램에서 상수 버퍼에 접근해야 하기 때문에)
사실 서술자를 따로 만들지 않아도 된다. 자원의 GPU 가상주소를 루트 매개변수로
6.6.5 루트 서명과 서술자 테이블
루트 매개변수는 3가지로 정의될 수 있다.
1. 루트 상수
2. 루트 서술자
3. 서술자 테이블
루트 서명은 루트 매개변수의 배열이다.
루트 서명에는 최대 64개의 DWORD를 넣을 수 있는데
서술자 테이블: DWORD 하나
루트 서술자 : DWORD 두 개
루트 상수 : 32비트 상수당 DWORD 하나
CD3DX12_DESCRIPTOR_RANGE texTable;
texTable.Init(
D3D12_DESCRIPTOR_RANGE_TYPE_SRV,
2, // number of descriptors
2); // register t2,t3
// Root parameter can be a table, root descriptor or root constants.
CD3DX12_ROOT_PARAMETER slotRootParameter[4];
// Perfomance TIP: Order from most frequent to least frequent.
slotRootParameter[0].InitAsDescriptorTable(1, &texTable, D3D12_SHADER_VISIBILITY_PIXEL);
slotRootParameter[1].InitAsConstantBufferView(0); // register b0
slotRootParameter[2].InitAsConstantBufferView(1); // register b1
slotRootParameter[3].InitAsConstantBufferView(2); // register b2
위의 코드는 4개의 루트 파라미터중 1개는 서술자 테이블, 3개는 루트 서술자를 사용한 방법이다.
3가지 종류(srv, uav, cbv)의 서술자를 하나의 테이블에 저장하여 사용하고 싶다면 CD3DX12_DESCRIPTOR_RANGE table[3]의 형태로 선언해야 한다. srv는 t레지스터에 cbv는 b레지스터에 묶인다.
테이블은 서술자는 루트 파라미터 한 개를 사용해서 여러개의 서술자를 여러개의 레지스터와 묶어준다.
루트 서명은 어떤 레지스터에 어떤 루트 매개변수가 연관되는지(루트 서술자인지, 서술자 테이블인지, 루트 상수인지)를 정의 하는 역할이고 실제로 자원을 묶으려면 cmdlist->SetGraphicsRoot****을 호출해서 묶는다.
6.7 셰이더의 컴파일
셰이더 파일(.hlsl)은 이식성 있는 바이트 코드로 컴파일된 후에 그래픽 드라이버는 그 바이트 코드를 시스템의 GPU에 맞게 최적의 네이티브 명령들로 컴파일한다.
오프라인 컴파일 : 셰이더를 실행 시점에서 컴파일하지 않고 오프라인에서 개별적인 단계로 컴파일
ㄴ 복잡한 셰이더의 경우 컴파일에 시간이 오래 걸리는데, 오프라인에서 컴파일하면 게임의 로딩 시간이 빨라진다.
컴파일된 셰이더 파일(.cso)
진입점이 VS인 파일과 PS인 파일로 나누어 컴파일 될 수 있다. (.cso파일이 두 개)
오프라인 컴파일 방법이던 아니던 컴파일된 셰이더 목적 바이트코드는 ID3DBlob라는 범용 메모리 버퍼에 저장되고 파이프라인 상태객체를 서술할때 사용된다.
6.8 래스터화기 상태
D3D12_RASTERIZER_DESC 구조체를 서술하여 파이프라인 상태 객체 만들때 설정한다.