R はデータ マイナーや統計学者の間で非常に人気がありますが、その理由の 1 つは R に付属する広範なライブラリです。これらのツールや関数により、統計タスクを大幅に単純化し、データ操作、視覚化、Web クロール、機械学習などのタスクを簡単に実行できます。 dplyr パッケージは、データ操作の文法としても知られており、基本的にデータ操作のために頻繁に使用されるツールや関数を提供しています。 既存の変数の関数として動作する新しい変数を追加する

  • select(): 名前に基づいて変数を選択する
  • summarise(): 複数の値からデータを要約する
  • arrange(): 行の順序を変更する
  • さらに、要件に従ってグループ化した結果を返せる group_by() 関数が使用可能です。 dplyrパッケージをチェックアウトしたい場合は、tidyverseから取得するか、「install.packages(“dplyr”)」というコマンドで直接パッケージをインストールできます。
  • tidyr

    tidyr はTidyverseエコシステムのコアパッケージの1つで、その名前が示すように、乱雑なデータを整理するために使用されています。 さて、Tidyrデータとは何だろうと思われる方のために、それを明らかにしておきましょう。 Tidyr によると、Tidy データは、すべての列が変数、各行が観測値、各セルが特異値であることを示します。

    Tidyr によると、Tidy データは、Tidyverse 全体で使用するデータの格納方法であり、分析時間を短縮し生産的にすることができます。 このパッケージはtidyverseから、または次のコマンド “install.packages(“tidyr”)” によって入手できます。

    ggplot2

    ggplot2 はデータ可視化のためのトップRライブラリのひとつで、魅力的なチャート、グラフ、プロットを作成するために世界中の何千人ものユーザーによって活発に使用されています。 この人気の背景には、ggplot2 が、視覚化するデータ、スタイル、および使用するプリミティブなど、開発者からの最小限の入力を取り、残りをライブラリに任せて、視覚化プロセスを単純化するために作成されたことが挙げられます。 グラフにさらにカスタマイズ性を持たせたい場合は、RStudio などの IDE を使用して、よりきめ細かい制御を行うことができます。 ggplot2 は、tidyverse コレクションを介して、または “install.packages(“ggplot2″)” コマンドを介してスタンドアロン ライブラリを使用して入手できます。

    ggplot2関数について知るためにこのRドキュメントを読む-

    lubridate

    R はデータサイエンスの優れたプログラミング言語ですが、Rには不完全に感じる分野がいくつかあります。 その一つが、日付と時間の扱いです。 R で日付と時刻を広範囲に扱う人にとって、R の内蔵機能は面倒に感じるかもしれません。

    これを克服するために、私たちは lubridate という便利なパッケージを用意しています。 このパッケージは R の標準的な日付と時刻を処理するだけでなく、時間帯、夏時間、うるう日、さまざまなタイムゾーンのサポート、高速な時刻解析、および多くのヘルパー関数などの追加拡張機能も提供します。 あなたのプロジェクトが時刻と日付を扱う必要があるなら、tidyverseからlubridateパッケージを入手するか、”install.packages(“lubridate”) “コマンドでパッケージだけをインストールできます。

    ここでドキュメントを読む:

    lattice

    latticeは多変数データにフォーカスした優雅かつ強力なデータ可視化ライブラリのひとつです。 このライブラリーが特別なのは、通常の可視化処理に加えて、lattice が非標準的な状況や要件に対するサポートを用意していることです。 RのためのTrellisグラフィックスの実用的な実装であるため、Trellisグラフを作成することができ、あなたの要求に応じてグラフを調整するオプションさえ提供します。latticeはRにデフォルトで付属していますが、latticeExtraという高度なバージョンのlatticeがあり、latticeが提供するコア機能を拡張したい場合には便利でしょう。

    mlr

    The Machine Learning in R(mlr) は、2013年にリリースされたライブラリで、2019年に新しい技術、より良いアーキテクチャ、コア設計でmlr3へとアップデートされました。 現在のところ、このライブラリは、いくつかの分類、回帰、サポート ベクトル マシン、および他の多くの機械学習活動に対応するフレームワークを提供します。

    mlr3 は、機械学習の実務家や研究者を対象としており、さまざまな機械学習アルゴリズムのベンチマークと展開をそれほど苦労することなく容易にすることが可能です。 mlr3は、既存の学習器を拡張したり、組み合わせたり、タスクに最適なテクニックを微調整したい人にとって、完璧なオプションであることが分かるでしょう。

    The wide range of functions are mentioned here –

    caret

    Short for Classification And REgression Training, the caret library provides several functions to optimize the process of model training for tricky regression and classification problems. Caret にはデータ分割、変数重要度推定、特徴選択、前処理など、タスク用の追加ツールや関数がいくつか付属しています。 caretを使えば、モデルの性能を測定することもできますし、tuneLengthやtuneGridといった様々なパラメータを使って、モデルの挙動を要件に応じて微調整することも可能です。 パッケージ自体は使いやすく、必要なコンポーネントのみを随時ロードしていきます。 ライブラリは “install.packages(“caret”)” というコマンドでインストールできます。

    esquisse

    esquisse はそれ自体ライブラリではなく、強力なデータ可視化ライブラリ ggplot2 のアドインとして提供されているものです。 ggplot2 はすでに十分にスマートですが、もしあなたの可視化に直感的な追加レイヤーが必要なら、esquisse は正しい方法です。esquisse では、必要なデータをドラッグアンドドロップするだけで、必要なカスタマイズオプションを選択し、短時間でカスタマイズしたプロットを構築し、選択したアプリケーションにエクスポートする準備が完了します。 esquisse では、棒グラフ、ヒストグラム、散布図、SF オブジェクトなどのビジュアライゼーションを作成できます。 install.packages(“esquisse”)” で esquisse を環境に追加できます。

    shiny

    shiny は RStudio によるウェブアプリケーションフレームワークで、開発者は最小限のウェブ開発の経歴で R による対話式のウェブアプリケーションを作成することが可能です。 shiny を使用すると、Web ページ、インタラクティブな可視化、ダッシュボードを構築し、さらに R ドキュメントにウィジェットを埋め込むことができます。 また、プロット、テーブル、R オブジェクトの出力を表示するための魅力的な組み込みウィジェットが多数用意されており、shiny でコーディングしたものは即座に公開されるので、ページを頻繁に更新するような煩わしさはありません。 もしあなたがその機能に納得し、試してみたいなら、”install.packages(“shiny”) “というコマンドを使って shiny を入手することができます。

    Rcrawler

    もしあなたがウェブサイトからデータを、それも理解できる形式でかき集めるツールを探しているなら、Rcrawler はあなたにとって正しい選択肢となるはずです。 Rcrawler の強力な Web クロール、データ スクラップ、およびデータ マイニング機能を使用すると、Web サイトをクロールしてデータを収集するだけでなく、内部および外部のハイパーリンクを含む任意の Web サイトのネットワーク構造を分析することも可能です。 Rcrawlerパッケージは、ウェブサイト上のすべてのページを通過してデータを抽出するので、1つのソースからすべての情報を一度に収集しようとしているときに非常に便利です。 このパッケージは “install.packages(“Rcrawler”)” というコマンドでインストールできます。

    DT

    DT パッケージは DataTables という JavaScript ライブラリの R 用ラッパーとして機能します。DT によって、R の行列内のデータを HTML ページ上の対話式のテーブルに変換し、データの検索、ソート、フィルタリングを簡単に行うことができるようになります。 このパッケージは、メイン関数であるdatatable()関数に、RオブジェクトのためのHTMLウィジェットを作成させることで動作します。 DTでは、”options “引数でさらに細かい設定ができ、テーブルのカスタマイズも可能です。 DT パッケージは “install.packages(“DT”)” コマンドでインストールできます。

    plotly

    もしあなたがショーを奪うようなインタラクティブな視覚化を作成したいならば、plotly はあなたに最適でしょう。 Plotly を使えば、散布図や折れ線グラフ、棒グラフ、円グラフ、ヒストグラム、ヒートマップ、等高線グラフ、時系列など、多様なチャートやグラフのコレクションから、出版に値するような素晴らしい視覚化を作成でき、plotly はそれを作成することが可能です。 plotly.jsライブラリの上に構築されたplotlyの可視化は、Dashを介したWebアプリケーションやJupyter Notebooksで表示したり、HTMLファイルとして保存したりすることもできます。 このパッケージを試してみたい方は、「install.packages(“plotly”)」というコマンドでインストールすることができます。

    その他の価値あるRライブラリ –

    • BioConductor
    • Knitr
    • Janitor
    • randomForest
    • e1071
    • stringr
    • data.DATA.DATA
    • BioConductor RandomForest RandomForest

    • RandomForest
    • RandomForest
    • RMarkdown
    • Rvest

    コメントを残す

    メールアドレスが公開されることはありません。