C++におけるメモリ管理 (パート4)

2023年10月14日 23:14

この記事では、C++における(7) メモリセーフティと(8) メモリ最適化テクニックについて説明したいと思います。これは　C++におけるメモリ管理（パート3）の続きです。パート3に興味があってお読みになりたい方は、以下のリンクをご参照ください。

(7.i) バッファーオーバーフローとスタックスマッシング

バッファオーバーフローとは？

バッファオーバーフローは、データが割り当てられたメモリバッファ（配列など）の終わりを超えて書き込まれる状況のことを指します。バッファが保持できる以上のデータが書き込まれると、余分なデータは隣接するメモリ領域に流れ込んでしまいます。

バッファオーバーフローがなぜ発生するのか？

バッファオーバーフローは、通常次のような理由で発生します：

入力の妥当性検証が不足していること。
安全でないメモリ操作が行われていること。
配列の境界を確認しないこと。

バッファオーバーフローの例 :

以下は、バッファオーバーフローが発生する例です：

#include <iostream>

int main() 
{
    int arr[5];
    for (int i = 0; i <= 5; i++) 
    {  
        // 意図的なバッファオーバーフロー
        arr[i] = i;
    }
    return 0;
}

この例では、5つの数値を格納する配列arrを使用していますが、わざと6つ目の値を書き込んで配列の境界を超えてしまい、バッファオーバーフローが発生します。

バッファオーバーフローの影響 :

バッファオーバーフローは次のような影響を及ぼす可能性があります：

データの破損：意図せず重要なデータや制御構造を上書きする可能性があります。
プログラムのクラッシュ：メモリの破損によりプログラムが予期せず停止することがあります。

バッファオーバーフローの防止方法 :

バッファオーバーフローを防ぐためには、以下の方法があります：

1. 動的なコンテナの使用（例：std::vector）：メモリを自動的に調整するC++標準ライブラリのコンテナ（std::vectorなど）を使用します。

#include <iostream>
#include <vector>

int main() 
{
    std::vector<int> safeContainer;
    for (int i = 0; i <= 5; i++)
    {  
        // バッファオーバーフローのリスクはありません
        safeContainer.push_back(i);
    }
    return 0;
}

この例では、自動的にサイズ調整されるstd::vectorを使用しています。これにより、バッファオーバーフローのリスクが排除されます。

2. 境界の確認：静的な配列を使用する場合、常に要素へのアクセス前に境界を確認します。

#include <iostream>
#include <array>

int main() 
{
    std::array<int, 5> safeArray;
    for (int i = 0; i <= safeArray.size(); i++) 
       {  
         // 安全な境界チェック
         if (i < safeArray.size())
         {
            safeArray[i] = i;
         } 
        else 
         {
            // 境界外の状況を処理
         }
    }
    return 0;
}

この例では、std::arrayを使用し、要素にアクセスする前に常に境界を確認することにより、バッファオーバーフローを防いでいます。

3. 最大長を指定した安全な関数の使用（例：strncpy）：最大長を指定してデータをコピーしたり連結するための安全な関数（strncpyなど）を使用します。

#include <iostream>
#include <cstring>

int main() 
{
    char dest[10];
    char source[20] = "これは長い文字列です。";
    strncpy(dest, source, sizeof(dest) - 1);  // 最大長を指定した安全な文字列コピー
    dest[sizeof(dest) - 1] = '\0';  // ヌル終端
    return 0;
}

この改善例では、strncpyを使用して文字列を安全にコピーし、最大長を超えないように制限してバッファオーバーフローを防いでいます。

スタックスマッシングとは？

スタックスマッシングは、バッファオーバーフローの特定の形式で、関数呼び出しスタックを標的とするものです。これは、バッファオーバーフローがプログラムの制御フローを操作しようとする攻撃であり、通常、戻り番地を上書きします。

スタックスマッシングがなぜ発生するのか？

スタックスマッシングは、バッファオーバーフローが関数のスタックフレームを壊し、特に戻り番地を上書きすると発生します。攻撃者は、この脆弱性を悪用してプログラムを制御しようとすることができます。

スタックスマッシングの例 :

以下のプログラムには、ユーザーの入力を受け付けて、それを文字配列 buffer に格納する vulnerableFunction という関数が含まれています。この関数は、境界を確認しないままにユーザーからの入力を buffer に書き込むので、十分な入力が提供された場合には buffer をオーバーフローさせ、関数の戻り番地を上書きすることができ、スタックスマッシングが発生します。

#include <iostream>

void vulnerableFunction() 
{
    char buffer[32];
    // 境界を確認せずにユーザー入力を buffer に読み込む不安全な関数
    std::cin >> buffer;
}

int main() 
{
    vulnerableFunction();
    return 0;
}

この例では、vulnerableFunction がユーザーの入力を境界を確認せずに buffer に読み込んでいるため、スタックスマッシングのリスクがあります。

スタックスマッシングの防止 :

スタックスマッシングを防ぐためには、以下の方法があります：
1. 安全な関数の使用：データの入力時に安全な関数を使用し、入力データの制限を設定します。

#include <iostream>
#include <cstring>

int main() 
{
    char buffer[32];
    const char* input = "安全な入力データ";
    
    // 安全な関数、たとえばfgetsを使用してデータを安全にコピー
    fgets(buffer, sizeof(buffer), stdin);
    buffer[strcspn(buffer, "\n")] = '\0';  // 改行文字を削除
    return 0;
}

この改善例では、fgetsを使用してデータを安全にコピーし、バッファのサイズを指定してデータがバッファの境界を超えないように制限しています。また、改行文字を適切に削除しています。

2. スタック保護メカニズムの活用（例：スタックキャナリー）：スタックキャナリーを含むスタック保護メカニズムを有効にします。スタックキャナリーは、戻り番地の改ざんを検出するのに役立ちます。

#include <iostream>
#include <cstring>

// スタックキャナリーのサポートを有効にしてコンパイル（例：-fstack-protector オプション）

int main() 
{
    char buffer[32];
    const char* input = "安全な入力データ";
    
    // スタックキャナリーを含むスタック保護を有効にし、データの改ざんを検出
    strncpy(buffer, input, sizeof(buffer) - 1);
    buffer[sizeof(buffer) - 1] = '\0';  // ヌル終端
    return 0;
}

スタックスマッシングを防ぐためには、コンパイル時にスタックキャナリーなどのスタック保護メカニズムを有効にすることがあります。スタックキャナリーは、戻り番地の改ざんを検出するのに役立ちます。

(7.ii) 安全な文字列処理

安全な文字列処理は、文字列を操作する際によくあるプログラミングエラーやセキュリティの問題を防ぐために重要です。文字列を安全に処理することは、バッファオーバーフロー、スタックスマッシング、およびその他のセキュリティと安定性に関連するリスクを回避するのに役立ちます。安全な文字列処理は、コードが正しくかつ安全に動作することを確実にします。

文字列を安全に処理する方法:

1. 標準ライブラリ文字列（std::string）の使用：

C++はstd::stringクラスを提供しており、これは自動的に動的メモリの割り当てとサイズ変更を処理します。C++で文字列を操作する最も安全な方法です。

#include <iostream>
#include <string>

int main()
 {
    std::string safeString = "これは安全な文字列です。";
    std::cout << safeString << std::endl;
    return 0;
}

2. C-スタイル文字列のための安全な関数の使用：

C-スタイル文字列（文字配列）を操作する場合、バッファオーバーフローを防ぐためにstrncpy、strncat、およびsnprintfなどの安全な関数を使用します。これらの関数は最大長を指定できるため、バッファオーバーフローを回避できます。

#include <iostream>
#include <cstring>

int main() 
{
    char dest[20];
    const char* source = "安全な文字列処理。";
    strncpy(dest, source, sizeof(dest) - 1);
    dest[sizeof(dest) - 1] = '\0';  // 文字列をヌル終端
    std::cout << dest << std::endl;
    return 0;
}

3. 文字列の長さの検証：

ユーザーから提供される文字列の長さを常にチェックし、予想される制限を超えないことを確認します。

#include <iostream>
#include <string>

int main() 
{
    std::string userInput;
    std::cout << "文字列を入力してください：";
    std::cin >> userInput;

    if (userInput.length() <= 20) 
    {
        std::cout << "有効な入力：" << userInput << std::endl;
    } 
    else
    {
        std::cout << "入力が長すぎます。" << std::endl;
    }

    return 0;
}

(7.iii) ヌルポインタのデリファレンスを回避

C++におけるヌルポインタの参照を回避することは、プログラムのクラッシュや未定義の動作を防ぎ、無効なポインタを介したメモリアクセスから生じる予測不可能な結果を回避するために重要です。ヌルポインタは有効なメモリ位置を指しておらず、それらを参照しようとすると予測できない結果が生じる可能性があります。

ヌルポインタの参照を回避する方法:

1. ヌルポインタのチェック :

ヌルポインタを参照する前に、そのポインタがヌルでないかどうかを確認してください。このチェックを実行するために if 文を使用できます。

例:

int* ptr = nullptr;  // ヌルポインタを作成
if (ptr != nullptr) 
{
    int value = *ptr;  // ポインタがヌルでない場合にのみ参照を試みる
}

この例では、if 文がポインタがヌルでないかどうかを確認してから、それを参照しようとします。

2. スマートポインタの使用 :
C++は、std::shared_ptr、std::unique_ptr、std::weak_ptrなどのスマートポインタを提供しており、これらは指すオブジェクトの寿命を自動的に管理します。スマートポインタはヌルポインタの参照を防ぎます。

(8) メモリ最適化テクニック
メモリ最適化はC++プログラミングにおいて非常に重要で、システムリソースの効率的な利用を確保し、アプリケーションのパフォーマンスを向上させるために欠かせない要素です。

(8.i) メモリ断片化の削減
メモリ断片化は、メモリが割り当てられ、解放される際に小さな連続しないメモリブロックが残り、必要な大きな連続したメモリを確保するのが難しくなる現象です。

(8.ii) カスタムメモリ割り当て子
カスタムメモリ割り当ては、メモリ割り当てをより効率的に行うために、メモリ割り当てに対する細かい制御を提供します。以下はカスタムメモリ割り当てを使用してメモリを効率的に管理する方法の例です。固定サイズのメモリプールを使用し、メモリの割り当てと解放を追跡する簡単なカスタムアロケータを作成します。


#include <iostream>
#include <vector>

class CustomAllocator 
{
private:
    static const size_t POOL_SIZE = 1024; // メモリプールのサイズ
    char memoryPool[POOL_SIZE]; // 固定サイズのメモリプール
    std::vector<void*> allocatedBlocks; // 割り当てられたメモリを追跡するためのベクタ

public:
    CustomAllocator()
     {
        // メモリプールの初期化
        // 単純化のため、プール全体が最初は利用可能と仮定します。
        std::memset(memoryPool, 0, POOL_SIZE);
    }
    void* allocate(size_t size) 
    {
        // カスタムのメモリ割り当て戦略を実装
        // 単純化のため、基本的なファーストフィットアルゴリズムを使用します。
        for (size_t i = 0; i < POOL_SIZE; ) 
        {
            size_t* block = reinterpret_cast<size_t*>(&memoryPool[i]);
            size_t blockSize = *block;
            // ブロックが利用可能で必要なサイズ以上かどうかをチェック
            if (blockSize == 0 || blockSize >= size)
             {
                if (blockSize >= size + sizeof(size_t)) 
                {
                    // ブロックが必要なサイズより大きい場合は、ブロックを分割
                    size_t* nextBlock = reinterpret_cast<size_t*>(&memoryPool[i + size + sizeof(size_t)]);
                    *nextBlock = blockSize - size - sizeof(size_t);
                }
                *block = size;
                allocatedBlocks.push_back(&memoryPool[i + sizeof(size_t)]);
                return &memoryPool[i + sizeof(size_t)];
            }
            // 次のブロックに移動
            i += blockSize + sizeof(size_t);
        }
        // 適切なブロックが見つからない場合
        return nullptr;
    }
    void deallocate(void* ptr)
     {
        // カスタムの解放ロジックを実装
        // 単純化のため、ブロックを利用可能に印をつけるだけです。
        for (size_t i = 0; i < allocatedBlocks.size(); ++i) 
        {
            if (allocatedBlocks[i] == ptr) 
            {
                size_t* block = reinterpret_cast<size_t*>(reinterpret_cast<char*>(ptr) - sizeof(size_t));
                *block = 0; // ブロックを利用可能に印をつける
                allocatedBlocks.erase(allocatedBlocks.begin() + i);
                return;
            }
        }
    }
};

int main() 
{
    CustomAllocator allocator;
    int* arr1 = static_cast<int*>(allocator.allocate(sizeof(int) * 10));
    // 割り当てられたメモリを使用
    allocator.deallocate(arr1);
    char* arr2 = static_cast<char*>(allocator.allocate(sizeof(char) * 100));
    // 割り当てられたメモリを使用
    allocator.deallocate(arr2);
    return 0;
}

この例では、CustomAllocator クラスは固定サイズのメモリプールを管理し、単純なファーストフィット割り当て戦略を使用しています。 allocate メソッドはメモリプール内で適切なメモリブロックを探し、割り当てられたメモリを追跡します。 deallocate メソッドは、メモリの解放時にメモリを利用可能として印をつけます。

(8.iii) コンパイラの最適化

現代のC++コンパイラは、メモリ使用量とプログラムのパフォーマンスに大きな影響を与えるいくつかの最適化テクニックを提供しています。これらのコンパイラ最適化とその利点について探ってみましょう。

1. 最適化レベルの指定

C++コンパイラは、コードの最適化レベルを制御するためのオプションを提供します。以下は一般的な最適化レベルの例です。

-O0（最適化なし）：このレベルは最適化を無効にし、デバッグに適しています。
-O1（基本的な最適化）：コードサイズを縮小しながらデバッグを容易にします。
-O2（中程度の最適化）：ランタイムパフォーマンスとコードサイズのバランスをとります。
-O3（高度な最適化）：最高のパフォーマンスを追求しますが、コードサイズが増加する可能性があります。

最適化レベルは、アプリケーションの要件に合わせて選択できます。最適化を活用することで、メモリ使用効率を向上させることができます。

2. インライン関数

インライン関数は、関数呼び出しのオーバーヘッドを削減し、コードの実行を高速化するための重要な最適化テクニックです。インライン関数は、関数宣言の前に inline キーワードを使用して定義されます。コンパイラは、その関数の呼び出し箇所で、関数の本体を直接挿入します。これにより、関数呼び出しに伴うスタックフレームの作成や破棄のオーバーヘッドが削減され、コードの実行が高速化されます。

以下はインライン関数の例です：

#include <iostream>

inline int add(int a, int b) 
{
    return a + b;
}

int main() 
{
    int result = add(5, 7);
    std::cout << "Result: " << result << std::endl;
    return 0;
}

この例では、add 関数がインライン関数として定義されています。コンパイラは add(5, 7) の呼び出し箇所で、return a + b; のコードを直接挿入し、関数呼び出しのオーバーヘッドを削減します。

3. デッドコードの削除

デッドコードの削除は、プログラム内で実行されないコードや未使用の変数、関数を識別し、それらをコンパイルから削除する最適化テクニックです。これにより、プログラムのコードサイズが削減され、実行効率が向上します。デッドコードは通常、条件分岐に関連しており、特定の条件下で実行されないコードブロックを指します。

以下はデッドコードの削除の例です：

#include <iostream>

int main()
 {
    int x = 42;
    int y = 0;
    if (x > 0)
    {
        y = 10;
    } 
    else 
    {
        y = 20; // この行のコードはデッドコード
    }
    std::cout << "y: " << y << std::endl;
    return 0;
}

この例では、x が常に正の値であるため、else ブロック内のコードはデッドコードとなります。コンパイラはこのコードを削除し、実行効率が向上します。

4. 未使用のデータと関数の削除

コンパイラは、プログラム内で使用されない変数や関数を識別し、それらを削除する最適化を実行できます。未使用のデータや関数がコードに残っている場合、プログラムのサイズが増加し、不要なメモリリソースが消費される可能性があります。この最適化により、コードサイズを削減し、メモリ使用効率を向上させることができます。

以下は未使用の関数の削除の例です：

#include <iostream>

// 未使用の関数
void unusedFunction() 
{
    std::cout << "This function is never used." << std::endl;
}

int main()
 {
    // main関数内で何もしない場合、unusedFunctionは未使用のまま
    return 0;
}

この例では、unusedFunction は呼び出されていないため、コンパイラはこの関数を削除し、不要なコードを取り除きます。

今記事では(7) メモリセーフティと(8) メモリ最適化テクニックについて議論いたしました。次回の記事(C++におけるメモリ管理 (パート5))では、(9) 並行性とメモリと(10) メモリ管理のベストプラクティスについて詳しく掘り下げ、お届けいたします。お楽しみにお待ちいただければ幸いです。

エンジニアファーストの会社 株式会社CRE-CO
su_myat_phyu