Analysis Tips
解析するうえで参考になる情報まとめ。Tweetはクリックするとスレッドが読めます。
Data Visualization
Making a heatmap is an essential skill for a bioinformatician.
— Ming "Tommy" Tang (@tangming2005) 2022年11月30日
But you probably do not understand heatmap. 7 reading resources to understand heatmap!👇🧵
compiled at https://t.co/H8KOw50mXx
A thread about using color as a design tool in science presentations. Color is a great tool to separate different categories of information, to highlight information, or to establish an emotional tone. 🧵1/20 pic.twitter.com/AHWxuWYdAT
— @IAmSciComm - On a Break! (@iamscicomm) 2022年5月31日
Check out Gosling, "A Grammar-based Toolkit for Scalable and Interactive Genomics Data Visualization"https://t.co/Eyyh488mcb
— Sean Davis (@seandavis12) 2022年7月21日
And an editable example!https://t.co/RffTYObTuX pic.twitter.com/MerP0rQ6xJ
Creating a cattle-mouse comparative browser view and use it to compare DNA methylation in heart, lung and liver between cow and mouse with the WashU Comparative Epigenome Browser. Work by @XiaoyuZhuo @SilasHsu @twang5 etc. Please check https://t.co/Lpk62Nulwe @biorxivpreprint pic.twitter.com/3T7ziAzUgi
— WashU Epigenome Browser (@wuepgg) 2022年12月3日
You can step up your data visualization game with {ggiraph} & {patchwork}.
— Albert Rapp (@rappa753) 2023年1月28日
Two premier tools for creating interactive, connected plots with click events and tool-tips. (And they're super easy to use too.)
Code: https://t.co/MwbHYjdVN1#rstats #dataviz pic.twitter.com/qup1n3mTro
plotly.expressのお気に入りグラフ3選 - Qiita
🤔Ever wondered where to find the best #dataviz projects ?
— Yan Holtz (@R_Graph_Gallery) 2023年1月11日
➡️I've done this for HOURS to build https://t.co/kwYyrJgAo6.
Let me share my favorite resources, and please tell me ⭐️yours⭐️!! pic.twitter.com/1Gjlsy8vI1
Data analysis
PCA is my go-to analysis tool for high-dimensional data.
— Ming "Tommy" Tang (@tangming2005) 2022年11月7日
8 links to BETTER understand principal component analysis (PCA):
Bookmark this blog post: https://t.co/ADBKssiBmC you want to find it later.
R analysis
A comprehensive review paper (https://t.co/lBBTEfKJjd), and blog on R packages for exploratory analysis (EDA). Some auto generate reports.
— Steven Ge (@StevenXGe) 2022年12月27日
Top 4 packages:
1. summarytools
2. DataExplorer
3. visdat
4. funModeling
Deep Exploratory Data Analysis (EDA) in R https://t.co/cpaBFS2P12
Rで背景情報や回帰の結果をきれいにまとめてくれるgtsummary。
— Sato Shuntaro|佐藤俊太朗 (@Shuntarooo3) 2022年12月3日
使ってるときの「あれどうするんだっけ?」に答える、かゆいところに手を届かせるコードまとめ。
yuzaR-Blog: R package reviews {gtsummary} Publication-Ready Tables of Data, Stat-Tests and Models! https://t.co/JfAhbvDBpY
Tidy-transcriptomics manifesto - Tidy transcriptomics
10 command-line and R tools to deal with excel, tsv, csv files👇🧵
— Ming "Tommy" Tang (@tangming2005) 2022年11月28日
compiled at here too https://t.co/rQJPgPl7Wi
Python analysis
うっ、嘘でしょ…たったコード一行でモデルのパフォーマンスが一括評価できちゃうの⁉️
— すきとほる, MPH | 疫学専門家 (@iznaiy_emjawak) 2022年4月25日
performanceパッケージのcheck_model()関数は、以下の図のように一瞬で正規性、等分散性、多重共線性、外れ値の影響など、仮定への適合性を”見える化”してくれます。
check_model(model名)って書くだけでOK。 pic.twitter.com/ck68sh0hDT
100本ノック
GitHub - rougier/numpy-100: 100 numpy exercises (with solutions)
GitHub - The-Japan-DataScientist-Society/100knocks-preprocess: データサイエンス100本ノック(構造化データ加工編)