お手伝いの yuki です。前回に引き続き、小ネタを紹介します。
みなさんは Rust でのバリデーションチェック時、どうしていますか?
あるいは多くの方は validator クレートを利用しているかと思います。私も業務でこのクレートを利用していますが、バリデーションチェックの情報をアノテーションに残しておくことができるため、どのフィールドにどのバリデーションチェックがかかる予定かがわかりやすく気に入っています。
その他の選択肢として最近出てきたのですが、Nutype というクレートがあります。このクレートについて今日は紹介したいと思います。
New Type Pattern
その前に前提知識としてひとつ Rust の実装パターンについて知っておく必要があります。というのもこのクレートはこの New Type という実装パターンを利用することを前提としているためです。Nutype (ニュータイプ)という音がまるっきり同じなことから想像がついたかたもいらっしゃるかもしれません。
Rust の New Type パターンはいわゆるオブジェクト指向における軽めのカプセル化です。型の内部の実装詳細を隠匿できるため、メンテナンス性の向上にも一役買うでしょう。あるいはたとえば関数の引数の型を厳しめに設定できるようになるため、引数の型の入れ違えをコンパイル時に未然に発見し防ぐことができるようになります。
そしてこの New Type Pattern を用いた型付けに、追加でマクロを使ってバリデーションチェックをかけられるようにするのが、今回紹介する Nutype というクレートです。名前の音がまったく同じですね。
Nutype はアトリビュート部分に特定の記述をすることにより、その型の受け付けられる値の条件をセットすることできます。たとえば整数値には最大値と最小値をセットすることができます。浮動小数点数では、NaN
加えて、バリデーションチェック後に返されるエラーの型も、簡易的ではありますが自動生成されます。ユーザーはとくに自分自身でエラーの型を定義する必要がない、ということです。Nutype はそもそも型付けを強くしましょう、そのために New Type の実装パターンを活用していきましょうという思想があるようです。エラー型が詳しく生成されるのもこの事情によっているのではないかと思います。
それでは簡単にですがサンプルを実装してみましょう。今回は株式の情報を集めるアプリを題材として適当なデータモデルを設計しておき、各フィールドに対して必要に応じて New Type パターンを用いながら、強く型付けしていくことを目指します。
use std::marker::PhantomData; use currency::Currency; use nutype::nutype; #[derive(Debug, Clone)] pub struct Stock<C> where C: Currency, { stock_symbol: TickerSymbol, name: String, last_sale: Price<C>, change_rate: Percent, market_cap: u128, } #[nutype( sanitize(trim, uppercase) validate(not_empty, max_len = 5) )] #[derive(*)] pub struct TickerSymbol(String); mod currency { pub struct Usd; impl Currency for Usd {} pub struct Jpy; impl Currency for Jpy {} pub trait Currency {} } #[derive(Debug, Clone)] pub struct Price<C: Currency>(f32, PhantomData<C>); #[nutype(validate(finite, min = -100.0, max = 100.0))] #[derive(*)] pub struct Percent(f32); fn main() {} #[test] fn ticker_symbol() { let ticker_symbol = "GOOGL"; let symbol = TickerSymbol::new(ticker_symbol); claim::assert_ok!(symbol); let ticker_symbol = "GOOG"; let symbol = TickerSymbol::new(ticker_symbol); claim::assert_ok!(symbol); // change the string to upper case let ticker_symbol = "goog"; let symbol = TickerSymbol::new(ticker_symbol); claim::assert_ok!(symbol); } #[test] fn sanitize_ticker_symbol() { let ticker_symbol = " GOOG "; let symbol = TickerSymbol::new(ticker_symbol); claim::assert_ok!(symbol); let ticker_symbol = "goog"; let symbol = TickerSymbol::new(ticker_symbol); claim::assert_ok!(symbol); } #[test] fn passed_empty_string_to_symbol() { let empty_symbol = "".to_string(); let symbol = TickerSymbol::new(empty_symbol); claim::assert_err!(symbol.clone()); claim::assert_matches!(symbol, Err(TickerSymbolError::Empty)); } #[test] fn passed_invalid_symbol() { let not_exist_such_symbol = "NONEXIST".to_string(); let symbol = TickerSymbol::new(not_exist_such_symbol); claim::assert_err!(symbol.clone()); claim::assert_matches!(symbol, Err(TickerSymbolError::TooLong)); } #[test] fn correct_percent() { let num = 0.589; let percent = Percent::new(num); claim::assert_ok!(percent); let num = -1.187; let percent = Percent::new(num); claim::assert_ok!(percent); } #[test] fn passed_invalid_percent() { let over_hundred = 101.0; let percent = Percent::new(over_hundred); claim::assert_err!(percent.clone()); claim::assert_matches!(percent, Err(PercentError::TooBig)); let nan = f32::NAN; let percent = Percent::new(nan); claim::assert_err!(percent.clone()); claim::assert_matches!(percent, Err(PercentError::NotFinite)); }
まず株式銘柄を示す Stock
#[derive(Debug, Clone)] pub struct Stock<C> where C: Currency, { stock_symbol: TickerSymbol, name: String, last_sale: Price<C>, change_rate: Percent, market_cap: u128, }
からみていきましょう。今回はここに Nutype クレートのアトリビュートをいくつかセットしました。Nutype ではこのように、#[nutype]
#[nutype( sanitize(trim, uppercase) validate(not_empty, max_len = 5) )] #[derive(*)] pub struct TickerSymbol(String);
Nutype の値チェックはふたつにわかれます。サニタイズ(sanitize)とバリデーション(validate)です。
たとえば、sanitize(trim, uppercase)
のように指定しておくと、" a "
という文字列が来た際に GOOG
#[test] fn sanitize_ticker_symbol() { let ticker_symbol = " GOOG "; let symbol = TickerSymbol::new(ticker_symbol); claim::assert_ok!(symbol); let ticker_symbol = "goog"; let symbol = TickerSymbol::new(ticker_symbol); claim::assert_ok!(symbol); }
という関数はとくに定義していないのですが、これも Nutype が裏で生成します。このコンストラクタの中でバリデーションチェックが行われます。new
関数の返りの型は Result
たとえば、validate(not_empty, max_len = 5)
#[test] fn passed_empty_string_to_symbol() { let empty_symbol = "".to_string(); let symbol = TickerSymbol::new(empty_symbol); claim::assert_err!(symbol.clone()); claim::assert_matches!(symbol, Err(TickerSymbolError::Empty)); } #[test] fn passed_invalid_symbol() { let not_exist_such_symbol = "NONEXIST".to_string(); let symbol = TickerSymbol::new(not_exist_such_symbol); claim::assert_err!(symbol.clone()); claim::assert_matches!(symbol, Err(TickerSymbolError::TooLong)); }
#[nutype(validate(finite, min = -100.0, max = 100.0))] #[derive(*)] pub struct Percent(f32);
浮動小数点数は NaN
や NegInifinity
型には NaN
を表現するビットパターンが222パターンほど存在します。これのせいで PartialEq
を付与できないなどの問題がありました。が、Nutype ではそれらを受け付けしないようにできます。finite
#[test] fn passed_invalid_percent() { let over_hundred = 101.0; let percent = Percent::new(over_hundred); claim::assert_err!(percent.clone()); claim::assert_matches!(percent, Err(PercentError::TooBig)); let nan = f32::NAN; let percent = Percent::new(nan); claim::assert_err!(percent.clone()); claim::assert_matches!(percent, Err(PercentError::NotFinite)); }
や PartialOrd
// たとえば、下記がコンパイルエラーにならない #[nutype(validate(finite, min = -100.0, max = 100.0))] #[derive(Debug, Clone, PartialEq, Eq, PartialOrd, Ord)] pub struct Percent(f32);
これは Debug
や Clone
などよく利用するトレイト実装を *
と指定するだけでまとめて生やしてくれる便利なアトリビュートです(余計なものまで生やすので意図しない挙動をしないか注意する必要がありますが)。生やされるトレイトはその型がラップする型に応じて変わりますが、たとえば String を内包する TickerSymbol の場合は、
- Eq
- PartialEq
- Ord
- PartialOrd
- Hash
- Clone
- Debug
あたりを自動でつけてくれます。f32 などのコピーセマンティクスな型を内包する Percent などにはさらに Copy
最後にこのクレートがどのような実装によって実現されているかですが、非常に単純でマクロを使ってひたすら必要な情報を生やしているだけです。cargo expand
#![feature(prelude_import)]
#[prelude_import]
use std::prelude::rust_2021::*;
#[macro_use]
extern crate std;
use std::marker::PhantomData;
use currency::Currency;
use nutype::nutype;
pub struct Stock<C>
where
    C: Currency,
{
    stock_symbol: TickerSymbol,
    name: String,
    last_sale: Price<C>,
    change_rate: Percent,
    market_cap: u128,
}
#[automatically_derived]
impl<C: ::core::fmt::Debug> ::core::fmt::Debug for Stock<C>
where
    C: Currency,
{
    fn fmt(&self, f: &mut ::core::fmt::Formatter) -> ::core::fmt::Result {
        ::core::fmt::Formatter::debug_struct_field5_finish(
            f,
            "Stock",
            "stock_symbol",
            &self.stock_symbol,
            "name",
            &self.name,
            "last_sale",
            &self.last_sale,
            "change_rate",
            &self.change_rate,
            "market_cap",
            &&self.market_cap,
        )
    }
}
// ... (macro-generated code continues)
#[doc(hidden)]
mod __nutype_private_TickerSymbol__ {
    use super::*; pub struct TickerSymbol(String);
    // ... (auto-derived trait implementations)
    pub enum TickerSymbolError {
        Empty,
        TooLong,
    }
    // ... (more auto-derived implementations)
    impl TickerSymbol {
        pub fn new(
            raw_value: impl Into<String>,
        ) -> ::core::result::Result<Self, TickerSymbolError> {
            fn sanitize(value: String) -> String {
                let value: String = value.trim().to_string();
                let value: String = value.to_uppercase();
                value
            }
            fn validate(val: &str) -> ::core::result::Result<(), TickerSymbolError> {
                let chars_count = val.chars().count(); if val.is_empty() {
                    return Err(TickerSymbolError::Empty);
                }
                if chars_count > 5usize {
                    return Err(TickerSymbolError::TooLong);
                }
                Ok(())
            }
            let sanitized_value = sanitize(raw_value.into());
            validate(&sanitized_value)?;
            Ok(TickerSymbol(sanitized_value))
        }
    }
    // ... (more trait implementations)
} pub use __nutype_private_TickerSymbol__::TickerSymbol; pub use __nutype_private_TickerSymbol__::TickerSymbolError;
// ... (Price struct and implementations)
#[doc(hidden)]
mod __nutype_private_Percent__ {
    use super::*;
    pub struct Percent(f32);
    // ... (auto-derived traits)
    pub enum PercentError {
        NotFinite,
        TooSmall,
        TooBig,
    }
    // ... (more implementations)
    impl Percent {
        pub fn new(raw_value: f32) -> ::core::result::Result<Self, PercentError> {
            fn sanitize(mut value: f32) -> f32 {
                value
            }
            fn validate(val: f32) -> core::result::Result<(), PercentError> {
                if !val.is_finite() {
                    return Err(PercentError::NotFinite); }
                if val < -100f32 {
                    return Err(PercentError::TooSmall);
                }
                if val > 100f32 {
                    return Err(PercentError::TooBig);
                }
                Ok(())
            }
            let sanitized_value = sanitize(raw_value);
            validate(sanitized_value)?;
            Ok(Percent(sanitized_value))
        }
    }
    // ... (more implementations)
} // ... (PercentError Display and Error implementations continue) // ... (more Percent implementations) // ... (FromStr and other trait implementations for Percent) pub use __nutype_private_Percent__::Percent;
pub use __nutype_private_Percent__::PercentError;
pub use __nutype_private_Percent__::PercentParseError;
fn main() {}
NewType パターンを用いて強めに型付けをしたい際に利用できるバリデーションチェック用のクレートを紹介しました。これから機能が増えることが期待されるクレートです。PhantomData
をもつ型は対応できていないようですが、これを対応してもらえると少し利用できる幅が広がるかもしれないとは思いました(PhantomData をもつものは NewType とは呼ばないのかもしれませんが…)。