balibabu
commited on
Commit
·
c058dac
1
Parent(s):
0dc6759
feat: Add html to the description text of the parsing method general #336 (#2432)
Browse files### What problem does this PR solve?
feat: Add html to the description text of the parsing method general
#336
### Type of change
- [x] New Feature (non-breaking change which adds functionality)
- web/src/locales/en.ts +1 -1
- web/src/locales/zh-traditional.ts +1 -1
- web/src/locales/zh.ts +1 -1
web/src/locales/en.ts
CHANGED
@@ -200,7 +200,7 @@ export default {
|
|
200 |
We assume manual has hierarchical section structure. We use the lowest section titles as pivots to slice documents.
|
201 |
So, the figures and tables in the same section will not be sliced apart, and chunk size might be large.
|
202 |
</p>`,
|
203 |
-
naive: `<p>Supported file formats are <b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML</b>.</p>
|
204 |
<p>This method apply the naive ways to chunk files: </p>
|
205 |
<p>
|
206 |
<li>Successive text will be sliced into pieces using vision detection model.</li>
|
|
|
200 |
We assume manual has hierarchical section structure. We use the lowest section titles as pivots to slice documents.
|
201 |
So, the figures and tables in the same section will not be sliced apart, and chunk size might be large.
|
202 |
</p>`,
|
203 |
+
naive: `<p>Supported file formats are <b>DOCX, EXCEL, PPT, IMAGE, PDF, TXT, MD, JSON, EML, HTML</b>.</p>
|
204 |
<p>This method apply the naive ways to chunk files: </p>
|
205 |
<p>
|
206 |
<li>Successive text will be sliced into pieces using vision detection model.</li>
|
web/src/locales/zh-traditional.ts
CHANGED
@@ -191,7 +191,7 @@ export default {
|
|
191 |
我們假設手冊具有分層部分結構。我們使用最低的部分標題作為對文檔進行切片的樞軸。
|
192 |
因此,同一部分中的圖和表不會被分割,並且塊大小可能會很大。
|
193 |
</p>`,
|
194 |
-
naive: `<p>支持的文件格式為<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML</b>。</p>
|
195 |
<p>此方法將簡單的方法應用於塊文件:</p>
|
196 |
<p>
|
197 |
<li>系統將使用視覺檢測模型將連續文本分割成多個片段。</li>
|
|
|
191 |
我們假設手冊具有分層部分結構。我們使用最低的部分標題作為對文檔進行切片的樞軸。
|
192 |
因此,同一部分中的圖和表不會被分割,並且塊大小可能會很大。
|
193 |
</p>`,
|
194 |
+
naive: `<p>支持的文件格式為<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML、HTML</b>。</p>
|
195 |
<p>此方法將簡單的方法應用於塊文件:</p>
|
196 |
<p>
|
197 |
<li>系統將使用視覺檢測模型將連續文本分割成多個片段。</li>
|
web/src/locales/zh.ts
CHANGED
@@ -192,7 +192,7 @@ export default {
|
|
192 |
我们假设手册具有分层部分结构。 我们使用最低的部分标题作为对文档进行切片的枢轴。
|
193 |
因此,同一部分中的图和表不会被分割,并且块大小可能会很大。
|
194 |
</p>`,
|
195 |
-
naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML</b>。</p>
|
196 |
<p>此方法将简单的方法应用于块文件:</p>
|
197 |
<p>
|
198 |
<li>系统将使用视觉检测模型将连续文本分割成多个片段。</li>
|
|
|
192 |
我们假设手册具有分层部分结构。 我们使用最低的部分标题作为对文档进行切片的枢轴。
|
193 |
因此,同一部分中的图和表不会被分割,并且块大小可能会很大。
|
194 |
</p>`,
|
195 |
+
naive: `<p>支持的文件格式为<b>DOCX、EXCEL、PPT、IMAGE、PDF、TXT、MD、JSON、EML、HTML</b>。</p>
|
196 |
<p>此方法将简单的方法应用于块文件:</p>
|
197 |
<p>
|
198 |
<li>系统将使用视觉检测模型将连续文本分割成多个片段。</li>
|